Ціль: Отримання інсайтів, виявлення взаємозв’язків та підтвердження гіпотез для моделювання.

1. Описова Статистика (Descriptive Statistics)

Підсумовування даних для розуміння центральної тенденції та розкиду.

A. Середнє значення (Mean)

Формула: $\bar{x} = (1/n) * \sum (x_i)$

Пояснення показників:

Код: df['колонка'].mean()

B. Стандартне відхилення (Standard Deviation, $s$)

Міра розкиду (варіативності) значень даних відносно середнього.

Формула: $s = \sqrt{\frac{1}{n-1} \sum (x_i - \bar{x})^2}$

Пояснення показників:

Код: df['колонка'].std()

2. Кореляція та Коефіцієнт Пірсона (Correlation & Pearson Coefficient)

Вимірювання сили та напрямку лінійної залежності між $X$ та $Y$.