Сезонність в даних часового ряду — це наявність коливань, які відбуваються через певні регулярні проміжки часу менше року, наприклад щомісяця чи щокварталу. Сезонність може бути спричинена різними факторами, такими як погода, відпустка та свята[1], і складається з періодичних, повторюваних і загалом регулярних і передбачуваних шаблонів поведінки[2] часового ряду.

Сезонні коливання в часовому ряді можна протиставити циклічним патернам. Останні виникають, коли дані демонструють підйоми та спади, які не мають фіксованого періоду. Такі несезонні коливання зазвичай зумовлені економічними умовами і часто пов'язані з «діловим циклом»; їхній період зазвичай виходить за межі одного року, і коливання зазвичай тривають щонайменше два роки.[3]

Організації, які стикаються з сезонними коливаннями, наприклад продавці морозива, часто зацікавлені в тому, щоб знати свої показники порівняно з нормальними сезонними коливаннями. Інший приклад, — сезонні зміни на ринку праці, можна пояснити виходом на ринок праці випускників шкіл, які прагнуть отримати роботу після завершення навчання. Ці регулярні зміни становлять менший інтерес для тих, хто вивчає дані про зайнятість, ніж зміни, які відбуваються через загальний стан економіки; їхня увага зосереджена на тому, як змінився рівень безробіття серед робочої сили, попри вплив регулярних сезонних коливань.[3]

Організаціям необхідно виявляти та вимірювати сезонні коливання на ринку, де вони працюють, щоб краще спланувати свою діяльність на майбутнє. Це може допомогти підготуватися до тимчасового збільшення або зменшення потреб у робочій силі та товарних запасах у зв'язку з коливаннями попиту на їхній продукт чи послугу протягом певних періодів. Це може вимагати навчання, періодичного сервісного супроводу тощо, яке можна організувати заздалегідь. Крім цих міркувань, організаціям необхідно знати, чи були коливання, яких вони зазнали, більшими чи меншими за очікувані, і чи не перевищують вони звичайні сезонні коливання.

Мотивація ред.

Існує кілька основних причин для вивчення сезонних коливань:

  • Опис сезонного ефекту дозволяє краще зрозуміти вплив цього компонента на конкретний ряд.
  • Після виявлення сезонної моделі можна застосувати методи для її вилучення з часових рядів для вивчення впливу інших компонентів, таких як циклічні та нерегулярні коливання. Таке усунення сезонного ефекту називається десезонністю або сезонним коригуванням[en] даних.
  • Використання минулих моделей сезонних коливань для прогнозування та передбачення майбутніх тенденцій, наприклад, таких як кліматологічні норми[en].

Виявлення ред.

Для виявлення сезонності можна використовувати такі графічні методи:

Дійсно ефективний спосіб знайти періодичність, у тому числі сезонність, у будь-якому часовому ряді даних — спочатку видалити тренд, а потім проаналізувати періодичність у часі.[5]

Побудова графіка часового ряду є рекомендованим першим кроком для аналізу будь-якого часового ряду. Хоча на цьому графіку іноді можна вказати сезонність, сезонність більш чітко показана на графіку сезонного частинного ряду або коробковому графіку. Графік сезонності частинного ряду чудово показує як сезонні відмінності (між групами), так і патерни групи. Коробковий графік досить добре показує сезонну різницю (між патернами груп), але вона не відображається в патернах груп. Однак для великих наборів даних коробковий графік зазвичай легше читати, ніж графік сезонності частинного ряду.

 
Діаграма автокореляції даних про споживання пива в Австралії.

Графік сезонності всього або частини ряду та коробковий графік припускають, що сезонні періоди відомі. У більшості випадків аналітик насправді це знає. Наприклад, для даних сгрупованих по місяцям період дорівнює 12, оскільки в році 12 місяців. Однак, якщо період невідомий, може стати в нагоді графік автокореляції. Якщо є значна сезонність, автокореляційний графік повинен показувати піки з лагом, який дорівнює періоду. Наприклад, для даних по місяцях, якщо існує ефект сезонності, ми очікуємо побачити значні піки на лагах 12, 24, 36 і так далі (хоча інтенсивність може зменшуватися з кожним наступним лагом).

Діаграма автокореляції може бути використана для виявлення сезонності, оскільки вона обчислює різницю (залишкову суму) між значенням Y і лаговим значенням Y. Отриманий графік показує деякі точки, де два значення близькі один до одного (без сезонності), але є й інші точки, де спостерігається велика розбіжність. Ці точки вказують на рівень сезонності в даних.

З напіврегулярними циклічними варіаціями можна мати справу за допомогою оцінки спектральної густини[en].

Розрахунок ред.

Сезонні коливання вимірюються за допомогою індексу, який називається індексом сезонності. Це середнє значення, яке можна використовувати для порівняння фактичного спостереження з тим, яким воно було б за відсутності сезонних коливань. Значення індексу прив'язується до кожного періоду часового ряду в межах року. Це означає, що якщо розглядати місячні дані, то існує 12 окремих індексів сезонності, по одному для кожного місяця. Наступні методи використовують індекси сезонності для вимірювання сезонних коливань даних часового ряду.

Метод простих середніх ред.

Вимірювання сезонних коливань за допомогою методу відношення до ковзного середнього дає змогу отримати індекс для вимірювання ступеня сезонних коливань у часовому ряді. Індекс ґрунтується на середньому значенні, що дорівнює 100, а ступінь сезонності вимірюється за відхиленнями від базового значення. Наприклад, розглянемо оренду готелів на зимовому курорті. Нехай індекс зимового кварталу дорівнює 124. Значення 124 вказує на те, що 124 відсотки середньоквартальної оренди припадає на зиму. Якщо адміністрація готелю зафіксувала 1436 оренд за весь минулий рік, то середньоквартальний показник оренди становитиме 359 = (1436/4). Оскільки індекс зимового кварталу дорівнює 124, ми оцінюємо кількість зимових оренд в такий спосіб:

359*(124/100)=445;

Тут 359 — середня квартальна орендна плата. 124 — індекс зимового кварталу. Сезонна оренда зимового кварталу — 445.

Цей метод також називають методом відсоткового ковзного середнього. У цьому методі вихідні значення даних у часовому ряді виражаються у відсотках від ковзних середніх. Нижче описано та реалізовано кроки для розрахунку для конкретної таблиці з даними.

Метод відношення до тренду ред.

  1. Знайдіть 12 центрованих місячних (або 4 квартальних) ковзних середніх значень вихідних даних у часовому ряді.
  2. Виразіть кожне значення вихідних даних часового ряду у відсотках від відповідного центрованого ковзного середнього значення, отриманого на кроці (1). Іншими словами, в мультиплікативній моделі часового ряду ми отримуємо (Вихідні дані) / (Значення тренду) × 100 = (T × C × S × I) / (T × C) × 100 = (S × I) × 100. Де T, C, S, I — відповідні складові тренду, циклу, сезонності та нерегулярності (шуму). Це означає, що відношення до ковзного середнього представляє сезонні та нерегулярні складові.
  3. Розподіліть ці відсотки за місяцями або кварталами заданих років. Знайдіть середні значення за всіма місяцями або кварталами заданих років.
  4. Якщо сума цих індексів не дорівнює 1200 (або 400 для квартальних даних), помножте їх на поправочний коефіцієнт = 1200 / (сума місячних індексів). Таким чином, ми отримали 12 середньомісячних індексів, які є індексами сезонності.

Метод відношення до ковзного середнього ред.

Розрахуємо сезонний індекс методом відношення до ковзного середнього за такими даними:

Зразок даних
Рік/Квартали 1 2 3 4
1996 рік 75 60 54 59
1997 рік 86 65 63 80
1998 рік 90 72 66 85
1999 рік 100 78 72 93

Тепер розрахуємо 4 квартальних ковзних середніх та співвідношення до ковзних середніх:

Ковзні середні
Рік Квартал Оригінальні значення (Y) Сума рухомого вікна з 4 кварталів Ковзне середнє

4-х кварталів

Сума рухомого вікна з 2 кварталів Ковзне середнє

2-х кварталів (T)

Відношення до ковзного середнього (%) (Y)/ (T)*100
1996 рік 1 75  —
2 60  —
248 62,00
3 54 126,75 63,375  85.21
259 64,75
4 59 130,75 65,375  90,25
264 66,00
1997 рік 1 86 134,25 67,125 128.12
273 68,25
2 65 141,75 70,875  91,71
294 73,50
3 63 148,00 74,00  85.13
298 74,50
4 80 150,75 75,375 106.14
305 76,25
1998 рік 1 90 153,25 76,625 117,45
308 77,00
2 72 155,25 77,625  92,75
313 78,25
3 66 159,00 79,50  83.02
323 80,75
4 85 163,00 81,50 104.29
329 82,25
1999 рік 1 100 166,00 83,00 120,48
335 83,75
2 78 169,50 84,75  92.03
343 85,75
3 72  —
4 93  —
Розрахунок індексу сезонності
Роки/квартали 1 2 3 4 Всього
1996 рік  —  —  85.21  90,25
1997 рік 128.12  91,71  85.13 106.14
1998 рік 117,45  92,75  83.02 104.29
1999 рік 120,48  92.04  —  —
Всього 366,05 276,49 253,36 300,68
Середнє за сезоном 122.01  92.16  84,45 100,23 398,85
Скоригований середній сезонний показник 122,36  92,43  84,69 100,52 400

Тепер сума сезонних середніх становить 398,85. Отже, відповідний поправочний коефіцієнт становитиме 400/398,85 = 1,00288. Кожне середнє сезонне значення множиться на поправочний коефіцієнт 1,00288, щоб отримати скориговані індекси сезонності, як показано у наведеній вище таблиці.

Метод розкладання на компоненти ред.

1. У адитивній моделі часових рядів сезонний компонент оцінюється як:

S = Y - (T + C + I)

де:

S — Сезонні значення
Y — Фактичні значення часового ряду
T — Трендові значення
C — Циклічні значення
I — Нерегулярні значення.

2. У мультиплікативній моделі часових рядів сезонна складова виражається у відношенні та відсотках як

  • Мультиплікативна модель:  

Однак на практиці для отримання результату виконується усунення тренду часових рядів для того, щоб отримати  .

Це робиться шляхом ділення обох частин рівняння   на значення тренду T так, що  .

3. Десезоналізовані дані часових рядів матимуть лише компоненти тренду (T), циклу (C) та нерегулярності (I) і виражатимуться як:

  • Мультиплікативна модель:  

Моделювання ред.

Повністю регулярні циклічні коливання часового ряду можуть бути оброблені в аналізі часових рядів за допомогою синусоїдальної моделі[en] з однією або декількома синусоїдами, довжини періодів яких можуть бути відомі або невідомі залежно від контексту. З менш регулярними циклічними коливання можна мати справу, використовуючи спеціальну форму моделі ARIMA, яка може бути побудована таким чином, щоб враховувати циклічні коливання напівявно. Такі моделі представляють циклостаціонарні процеси[en].

Іншим методом моделювання сезонного коливання є використання пари членів ряду Фур'є. Подібно до використання синусоїдальної моделі, члени ряду Фур'є, додані до регресійної моделі, використовують синусоїдальні та косинусоїдальні члени для моделювання сезонності. Однак сезонність такої регресії буде представлена як сума синусоїдальних або косинусоїдальних членів, а не як один синусоїдальний або косинусоїдальний член у синусоїдальній моделі. Будь-яка періодична функція може бути апроксимована за допомогою членів ряду Фур'є.

Різницю між синусоїдальною моделлю та регресією з членами ряду Фур'є можна спростити до такого:

Синусоїдальна модель:

 

Регресія з членами ряду Фур'є:

 

Сезонне коригування ред.

Сезонне коригування або десезонізація — це будь-який метод видалення сезонної складової часового ряду. Отримані сезонно скориговані дані використовуються, наприклад, при аналізі або представленні несезонних тенденцій за триваліший період, ніж сезонний. Відповідний метод сезонного коригування вибирається на основі того, як відбувається розкладання часового ряду на компоненти, позначені такими назвами, як «тренд», «цикл», «сезонність» і «нерегулярність», а також на те, як вони взаємодіють між собою. Наприклад, такі компоненти можуть впливати адитивно або мультиплікативно. Таким чином, якщо сезонна складова впливає адитивно, метод коригування має два етапи:

  • оцінка сезонної складової варіації в часовому ряді, як правило, у формі, яка має нульове середнє значення для ряду;
  • відняти розрахунковий сезонний компонент з вихідного часового ряду, залишаючи сезонно скоригований ряд:  .[3]

Якщо це мультиплікативна модель, то величина сезонних коливань буде залежати від рівня, що є більш характерним для економічних рядів.[3] З урахуванням сезонності мультиплікативне розкладання, скориговане на сезонність, можна записати у вигляді  ; при цьому вихідний часовий ряд ділиться на розрахункову сезонну складову.

Мультиплікативну модель можна перетворити на адитивну, якщо взяти логарифм часового ряду.

Мультиплікативне розкладання:  

Логарифм часових рядів для мультиплікативної моделі:  [3]

Одну конкретну реалізацію сезонного коригування забезпечує X-12-ARIMA[en].

У регресійному аналізі ред.

У регресійному аналізі, такому як звичайний метод найменших квадратів[en], коли залежна змінна, що змінюється в залежності від сезону, перебуває під впливом однієї або кількох незалежних змінних, сезонність можна врахувати та виміряти шляхом включення n-1 фіктивних змінних[en], по одній для кожного сезону, за винятком довільно обраного сезону, який приймається за еталон, де n — кількість сезонів (наприклад, 4 у випадку метеорологічних сезонів, 12 у випадку місяців тощо).

Для кожної фіктивної змінної встановлюється значення 1, якщо точка даних взята із визначеного сезону, і 0 у протилежному випадку. Потім прогнозоване значення залежної змінної для базового сезону обчислюється з решти регресії, тоді як для будь-якого іншого сезону воно обчислюється з використанням решти регресії та додаванням значення 1 для фіктивної змінної для цього сезону.

Пов'язані патерни ред.

Важливо відрізняти сезонні закономірності від інших подібних закономірностей. Сезонна закономірність виникає тоді, коли на часовий ряд впливає зміна сезону або пора року, наприклад, річна, піврічна, квартальна тощо. Циклічна закономірність, або просто цикл, виникає, коли дані зростають і падають в інші періоди, тобто набагато довші (наприклад, десятирічні) або набагато коротші (наприклад, тижневі), ніж сезонні періоди. Квазіперіодичність[en] — це більш загальна, нерегулярна періодичність.


Див. також ред.

Примітки ред.

  1. Seasonality. |title=Influencing Factors|
  2. Archived copy. Архів оригіналу за 18 травня 2015. Процитовано 13 травня 2015.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  3. а б в г д 6.1 Time series components - OTexts.
  4. 2.1 Graphics - OTexts.
  5. time series - What method can be used to detect seasonality in data?. Cross Validated.
  • Barnett, A.G.; Dobson, A.J. (2010). Analysing Seasonal Health Data. Springer. ISBN 978-3-642-10747-4.
  • Complete Business Statistics (Chapter 12) by Amir D. Aczel.
  • Business Statistics: Why and When (Chapter 15) by Larry E. Richards and Jerry J. Lacava.
  • Business Statistics (Chapter 16) by J.K. Sharma.
  • Business Statistics, a decision making approach (Chapter 18) by David F. Groebner and Patric W. Shannon.
  • Statistics for Management (Chapter 15) by Richard I. Levin and David S. Rubin.
  • Forecasting: practice and principles by Rob J. Hyndman and George Athansopoulos

Посилання ред.