Модель авторегресії — ковзного середнього

У статистичному аналізі часових рядів моделі авторегресії — ковзного середнього (АРКС, англ. autoregressive–moving-average models, ARMA) пропонують економний опис (слабко) стаціонарного стохастичного процесу в термінах двох многочленів, одного для авторегресії (АР), а другого — для ковзного середнього[en] (КС). Загальну модель АРКС було описано 1951 року в дисертації Пітера Уіттла[en] «Перевірка гіпотез в аналізі часових рядів» і популяризовано в книзі Джорджа Бокса[en] та Ґвилима Дженкінса[en] 1970 року.

Для заданого часового ряду даних Xt модель АРКС є інструментом для розуміння та, можливо, передбачування майбутніх значень цього ряду. Частина АР передбачає регресування цієї змінної за її власними запізнюваними (тобто, минулими) значеннями. Частина КС передбачає моделювання члену похибки як лінійної комбінації членів похибки, що стаються в поточний момент та в різні моменти часу в минулому. На цю модель зазвичай посилаються як на модель АРКС(p, q), де p — порядок частини АР, а q — порядок частини КС (як визначено нижче).

Моделі АРКС може бути оцінювано за допомогою методу Бокса — Дженкінса[en].

Авторегресійна модель ред.

Детальніші відомості з цієї теми ви можете знайти в статті Авторегресійна модель.

Позначення АР(p) стосується авторегресійної моделі порядку p. Модель АР(p) записують як

 

де   є параметрами,   є сталою, а випадкова величина   є білим шумом.

Щоби ця модель залишалася стаціонарною, для значень цих параметрів необхідні деякі обмеження. Наприклад, процеси в моделі АР(1) за   стаціонарними не є.

Модель ковзного середнього ред.

Детальніші відомості з цієї теми ви можете знайти в статті Модель ковзного середнього[en].

Позначення КС(q) стосується моделі ковзного середнього порядку q:

 

де   є параметрами моделі,   є математичним сподіванням   (що часто вважають рівним 0), а  ,  , … є, знов-таки, членами похибки білого шуму.

Модель АРКС ред.

Позначення АРКС(p, q) стосується моделі з p авторегресійними членами та q членами ковзного середнього. Ця модель містить моделі АР(p) та КС(q),

 

Загальну модель АРКС було описано 1951 року в дисертації Пітера Уіттла[en], який використовував математичний аналіз (ряд Лорана та аналіз Фур'є) та статистичне висновування.[1][2] Моделі АРКС було популяризовано книгою 1970 року Джорджа Бокса[en] та Дженкінса[en], які виклали ітераційний метод (Бокса — Дженкінса[en]) для їхнього вибирання та оцінювання. Цей метод був корисним для многочленів нижчих порядків (третього або нижчого ступеня).[3]

Зауваження про члени похибки ред.

Члени похибки  , як правило, вважають незалежними однаково розподіленими випадковими величинами (НОР), відбираними з нормального розподілу з нульовим середнім:   ~ N(0, σ2), де σ2 є дисперсією. Ці припущення може бути послаблено, але це змінить властивості моделі. Зокрема, зміна припущення про НОР призведе до принципової відмінності.

Визначення в термінах оператора запізнювання ред.

В деяких текстах ці моделі визначатимуть у термінах оператора запізнювання L. В цих термінах модель АР(p) подають як

 

де   представляє многочлен

 

Модель КС(q) подають як

 

де θ представляє многочлен

 

Нарешті, об'єднану модель АРКС(p, q) подають як

 

або, лаконічніше,

 

або

 

Альтернативний запис ред.

Деякі автори, включно з Боксом[en], Дженкінсом[en] та Рейнзелем, використовують іншу угоду щодо коефіцієнтів авторегресії.[4] Це дозволяє всім многочленам, до яких входить оператор запізнювання, всюди мати подібний вигляд. Таким чином модель АРКС буде записано як

 

Більше того, якщо ми встановимо   та  , то отримаємо ще елегантніше формулювання:  

Пристосовування моделей ред.

Вибір р та q ред.

Пошук відповідних значень p та q в моделі АРКС(p, q) може бути полегшено шляхом побудови частинних автокореляційних функцій[en] задля оцінки p, а також використання автокореляційних функцій задля оцінки q. Додаткову інформацію можливо підбирати, розглядаючи ті ж функції для залишків моделі, пристосованої початковим вибором p та q.

Броквел та Девіс для пошуку р та q радять застосовувати інформаційний критерій Акаіке (ІКА).[5]

Оцінювання коефіцієнтів ред.

Моделі АРКС після вибору р та q загалом може бути пристосовувано за допомогою регресії найменших квадратів задля знаходження значень параметрів, які мінімізують член похибки. Загалом доброю практикою вважають знаходити найменші значення р та q, які забезпечують прийнятну пристосованість до даних. Для чистої моделі АР для забезпечення пристосованості можна використовувати рівняння Юла-Вокера.

Втілення в статистичних пакетах ред.

Застосування ред.

АРКС є доречною, коли система є функцією як ряду не спостережуваних струсів (частина КС, або ковзне середнє), так і своєї власної поведінки. Наприклад, ціни акцій можуть струшуватися основною інформацією, а також демонструвати технічні прямування та ефекти повернення до середнього[en] через учасників ринку.[джерело?]

Узагальнення ред.

Якщо не вказано інше, то залежність Xt від минулих значень та членів похибки εt вважається лінійною. Якщо ця залежність є нелінійною, то модель спеціально називають моделлю нелінійного ковзного середнього (НКС, англ. nonlinear moving average, NMA), нелінійної авторегресії (НАР, англ. nonlinear autoregressive, NAR) або нелінійної авторегресії — ковзного середнього (НАРКС, англ. nonlinear autoregressive–moving-average, NARMA).

Моделі авторегресії — ковзного середнього може бути узагальнювано й іншими способами. Див. також моделі авторегресії — умовної гетероскедастичності (АРУГ, англ. autoregressive conditional heteroskedasticity, ARCH) та моделі авторегресії — інтегрованого ковзного середнього (АРІКС, англ. autoregressive integrated moving average, ARIMA). Якщо потрібно пристосовуватися до декількох часових рядів, то можна пристосовувати векторну ​​модель АРІКС (або ВАРІКС, англ. VARIMA). Якщо часовий ряд, про який йдеться, демонструє довгу пам'ять, то може бути доцільним дробове (англ. fractional) моделювання АРІКС (ДАРІКС, англ. FARIMA, інколи зване АРДІКС, англ. ARFIMA): див. авторегресію — дробово інтегроване ковзне середнє[en]. Якщо вважається, що дані містять сезонні ефекти, то їх можна моделювати моделлю САРІКС (сезонна АРІКС, англ. SARIMA), або періодичною (англ. periodic) моделлю АРКС.

Іншим узагальненням є багатомасштабна авторегресійна (БАР, англ. multiscale autoregressive, MAR) модель. Модель БАР індексовано вузлами дерева, тоді як стандартну авторегресійну модель (дискретного часу) індексовано цілими числами.

Зауважте, що модель АРКС є одновимірною моделлю. Розширеннями для багатовимірного випадку є векторна авторегресія (ВАР, англ. vector autoregression, VAR) та векторна авторегресія — ковзне середнє (ВАРКС, англ. Vector Autoregression Moving-Average, VARMA).

Модель авторегресії — ковзного середнього з екзогенними входами (модель АРКСК, ARMAX) ред.

Позначення АРКСК(p, q, b) стосується моделі з p авторегресійними членами, q членами ковзного середнього та b членами екзогенних входів. Ця модель містить моделі АР(p) та КС(q), а також лінійну комбінацію останніх b членів відомих і зовнішніх часових рядів  . Її задають як

 

де   — параметри екзогенного входу  .

Було визначено деякі нелінійні варіанти моделей з екзогенними змінними: див., наприклад, нелінійну авторегресійну екзогенну модель.

Статистичні пакети втілюють модель АРКСК за допомогою «екзогенних», або «незалежних» змінних. При інтерпретуванні виходу цих пакетів слід бути обережними, оскільки оцінювані параметри зазвичай (наприклад, в R[7] та gretl) стосуються регресії

 

де до mt входять всі екзогенні (або незалежні) змінні:

 

Див. також ред.


Примітки ред.

  1. Hannan, Edward James (1970). Multiple time series. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons. (англ.)
  2. Whittle, P. (1951). Hypothesis Testing in Time Series Analysis. Almquist and Wicksell. (англ.) Whittle, P. (1963). Prediction and Regulation. English Universities Press. ISBN 0-8166-1147-5. (англ.)
    Перевидано як Whittle, P. (1983). Prediction and Regulation by Linear Least-Square Methods. University of Minnesota Press. ISBN 0-8166-1148-3. (англ.)
  3. Hannan та Deistler, (1988, p. 227) : Hannan, E. J.; Deistler, Manfred (1988). Statistical theory of linear systems. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons.
  4. Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time Series Analysis: Forecasting and Control (вид. Third). Prentice-Hall. ISBN 0130607746. (англ.)
  5. Brockwell, P. J.; Davis, R. A. (2009). Time Series: Theory and Methods (вид. 2nd). New York: Springer. с. 273. ISBN 9781441903198. (англ.)
  6. Функції часових рядів в Mathematica [Архівовано 24 листопада 2011 у Wayback Machine.] (англ.)
  7. ARIMA Modelling of Time Series [Архівовано 17 лютого 2019 у Wayback Machine.], документація R

Література ред.