Довірча та прогнозна смуги

Дові́рчу сму́гу[1] (англ. confidence band) використовують у статистичнім аналізі, щоби подавати невизначеність в оцінці кривої або функції, яка ґрунтується на обмежених або зашумлених даних. Подібним чином, прогно́зну сму́гу (англ. prediction band) використовують, щоби подавати невизначеність стосовно нової точки даних на кривій з урахуванням шуму. Довірчі та передбачувані смуги часто використовують як частину графічного подання результатів регресійного аналізу.

Довірчі смуги є тісно пов'язаними з довірчими інтервалами, які представляють невизначеність в оцінці єдиного чисельного значення. «Оскільки довірчі інтервали, за своєю побудовою, стосуються лише єдиної точки, вони є вужчими (в цій точці), аніж довірча смуга, яка повинна витримуватися одночасно в багатьох точках.»[2]

Поточкові та одночасні довірчі смуги ред.

Припустімо, що ми маємо на меті оцінити функцію f(x). Наприклад, f(x) може бути часткою людей певного віку x, які підтримують заданого кандидата на виборах. Якщо x вимірюють із точністю до одного року, ми можемо побудувати окремий 95 %-вий довірчий інтервал для кожного віку. Кожен із цих довірчих інтервалів покриває відповідне істинне значення f(x) із рівнем довіри 0,95. Узяті разом, ці довірчі інтервали складають поточково 95 %-ву довірчу смугу (англ. 95% pointwise confidence band) для f(x).

Мовою математики, поточкова довірча смуга   з імовірністю покриття 1 − α задовольняє наступну умову окремо для кожного значення x:

 

де   є точковою оцінкою f(x).

Імовірністю одночасного покриття (англ. simultaneous coverage probability) набору довірчих інтервалів є ймовірність того, що вони всі покривають свої відповідні істинні значення одночасно. В наведенім вище прикладі ймовірність одночасного покриття є ймовірністю того, що всі інтервали для x = 18, 19, … покривають свої істинні значення (виходячи з того, що 18 є наймолодшим віком, з якого особа може голосувати). Якщо кожен з інтервалів окремо має ймовірність покриття 0,95, то ймовірність одночасного покриття є загалом меншою за 0,95. Одночасно 95 %-ва довірча смуга (англ. 95% simultaneous confidence band) є набором довірчих інтервалів для всіх значень x в області визначення f(x), побудованим таким чином, щоби мати ймовірність одночасного покриття 0,95.

Мовою математики, одночасна довірча смуга   з імовірністю покриття 1 − α задовольняє наступну умову:

 

Майже в усіх випадках одночасна довірча смуга буде ширшою за поточкову довірчу смугу з такою ж імовірністю покриття. У визначенні поточкової довірчої смуги цей квантор загальності пересувається назовні функції ймовірності.

 
Довірчі смуги для імітованих даних, що зображують частку виборців, що підтримують заданого кандидата на виборах, як функцію від віку виборців. Показано поточково 95 %-ву довірчу смугу та одночасно 95 %-ву довірчу смугу, побудовану із застосуванням поправки Бонферроні.

Довірчі смуги в регресійнім аналізі ред.

Довірчі смуги зазвичай виникають в регресійнім аналізі.[3] У випадку простої регресії, що включає єдину незалежну змінну, результати може бути подано у вигляді графіку, що показує оцінену лінію регресії разом із або поточковою, або одночасною довірчою смугою. Широко вживаними методами побудови одночасних довірчих смуг у регресії є методи Бонферроні[en] та Шеффе[en], докладніше див. процедури контролю групової ймовірності помилки першого роду[en].

 
Довірчі смуги для простого лінійного регресійного аналізу з використанням імітованих даних. Показано поточково 95 %-ву довірчу смугу та одночасно 95 %-ву смугу, побудовану із застосуванням методу Шеффе[en].

Довірчі смуги для розподілів імовірності ред.

Детальніші відомості з цієї теми ви можете знайти в статті Непараметричний довірчий інтервал на основі ФРІ[en].

Довірчі смуги можливо будувати навколо оцінок емпіричної функції розподілу. Проста теорія дозволяє будувати поточкові довірчі інтервали, але можливо також будувати й одночасну довірчу смугу для функції розподілу ймовірності як цілого, обертаючи критерій Колмогорова — Смирнова[en], або використовуючи непараметричні правдоподібнісні методи.[4]

Інші застосування довірчих смуг ред.

Довірчі смуги виникають, коли статистичний аналіз зосереджується на оцінюванні функції.

Було також розроблено довірчі смуги для оцінок функцій густини, функцій спектральної густини,[5] функцій квантилів[en], згладжувань розсіювань[en], функцій виживаності[en] та характеристичних функцій.[джерело?]

Прогнозні смуги ред.

Прогнозні смуги пов'язано з прогнозними інтервалами[en][6] так само, як довірчі смуги пов'язано з довірчими інтервалами. Прогнозні смуги зазвичай виникають у регресійнім аналізі. Метою прогнозної смуги є покрити з приписаною ймовірністю значення одного або більше майбутніх спостережень з тієї ж генеральної сукупності, з якої було вибрано задані дані. Як і прогнозні інтервали є ширшими за довірчі інтервали, так і прогнозні смуги будуть ширшими за довірчі смуги.

Мовою математики, прогнозна смуга   з імовірністю покриття 1 − α задовольняє наступну умову для кожного значення x:

 

де y* є спостереженням, узятим із процесу породжування даних у заданій точці x, що не залежить від даних, використаних для побудови точкової оцінки   та довірчого[прояснити: ком.] інтервалу w(x). Це — поточковий прогнозний інтервал.[прояснити: ком.] Можливо було би побудувати й одночасний інтервал[прояснити: ком.] для скінченного числа незалежних спостережень, застосовуючи, наприклад, метод Бонферроні для розширювання інтервалу[прояснити: ком.] на відповідну величину.

Примітки ред.

  1. Загородна, Н.; Фриз, М. (2011). Оцінка точності методу короткотермінового прогнозу добового газоспоживання в опалювальний період (PDF). Тернопільський національний технічний університет імені Івана Пулюя. Архів оригіналу (PDF) за 14 травня 2018. Процитовано 8 березня 2021.
  2. p.65 in W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Nonparametric and Semiparametric Models, Springer, ISBN 3540207228 Archived copy. Архів оригіналу за 12 квітня 2013. Процитовано 6 лютого 2013.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання),[1] (англ.)
  3. Liu, W; Lin S.; Piegorsch W.W. (2008). Construction of Exact Simultaneous Confidence Bands for a Simple Linear Regression Model. International Statistical Review. 1: 39—57. doi:10.1111/j.1751-5823.2007.00027.x. (англ.)
  4. Owen, A. B. (1995). Nonparametric likelihood confidence bands for a distribution function. Journal of the American Statistical Association. American Statistical Association. 90 (430): 516—521. doi:10.2307/2291062. JSTOR 2291062. (англ.)
  5. Neumann, M.H.; Paparoditis, E. (2008). Simultaneous confidence bands in spectral density estimation. Biometrika. 95 (2): 381. CiteSeerX 10.1.1.569.3978. doi:10.1093/biomet/asn005. (англ.)
  6. Михайлов, В. С.; Полтавець, Л. Л. (2014). Підходи до статистичного прогнозування споживання енергетичних ресурсів. Статистика України. НДІ статистичних досліджень (1).