Відкрити головне меню
Критерій Пірсона.jpg

Критерій узгодженості Пірсона — один з найвідоміших критеріїв , тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.

Ґрунтується на групованих даних. Область значень передбачуваного розподілу ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.

Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи .
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом .
Позначимо для j=1,…,k через число елементів вибірки, що потрапили в інтервал :
,

і через  — теоретичну ймовірність попадання в інтервал випадкової величини з розподілом .
З необхідністю, .
Як правило, довжини інтервалів вибирають так, щоб .
Нехай (1).

ЗауваженняРедагувати

Якщо розподіл вибірки   має такі ж, як в  , імовірності   попадання в кожний з інтервалів  , то по даній функції  ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції  з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей   такий, що  . Критерій   призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}

Правило критеріюРедагувати

Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.

  Правило.
Якщо отримана статистика перевищує квантиль розподілу   заданого рівня значимості   з   або з   ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза   відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості  .


Теорема ПірсонаРедагувати

Якщо вірна гіпотеза H1', то при фіксованому k й при  :  

де, нагадаємо,  є  -розподіл зі   ступенем вільності.

ЗауваженняРедагувати

Насправді критерій   застосовують і для розв'язку первісного завдання про перевірку гіпотези  . Необхідно тільки пам'ятати, що цей критерій не заможний для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в  . Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.

Критерій Пірсона для перевірки параметричної гіпотезиРедагувати

Критерій   часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка   з невідомого розподілу  .
Перевіряється складна гіпотеза:  ,

де   — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай   розбите на k>lінтервалів  , і   — число елементів вибірки, що потрапили в . Але ймовірність   тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення:  (2.)
Нехай  - значення параметра  , що доставляє мінімум функції   при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки   , одержимо функцію відхилення: .

Див. такожРедагувати

ЛітератураРедагувати

  • Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.