⚖️ Стандартна Практика: Time Series Alignment

1. Контекст Задачі

При аналізі часових рядів з кількох джерел (наприклад, 5 аптек) виникає проблема різного покриття даних (different start/end dates).

Мета: Створити єдиний, порівнюваний датасет для коректного моделювання (наприклад, аналізу трендів, сезонності або субституції).

2. Ключовий Ризик: Помилка "Padding with Zeros"

Найбільша методологічна помилка — вважати, що "відсутність даних" дорівнює "нулю".

Критична Помилка (Padding with Zeros): Заповнення NaN періодів нулями (наприклад, для Аптеки B в діапазоні $[t_1, \dots, t_{29}]$) спотворює реальність. Це каже моделі, що "аптека 29 днів поспіль нічого не продавала", хоча насправді її просто не існувало.

Наслідок: Модель отримує сильний bias (зміщення), що руйнує оцінку середніх, дисперсії, трендів та сезонності.

3. Аналіз Підходів до Вирівнювання

1. Threshold-based Exclusion (Виключення за Порогом)

2. Padding with Zeros (Заповнення Нулями)