Критерій узгодженості Пірсона

Критерій узгодженості Пірсона — один з найвідоміших критеріїв , тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.

Ґрунтується на групованих даних. Область значень передбачуваного розподілу ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.

Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи .
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом .
Позначимо для j=1,…,k через число елементів вибірки, що потрапили в інтервал :
,

і через  — теоретичну ймовірність попадання в інтервал випадкової величини з розподілом .
З необхідністю, .
Як правило, довжини інтервалів вибирають так, щоб .
Нехай (1).

Зауваження ред.

Якщо розподіл вибірки   має такі ж, як в  , імовірності   попадання в кожний з інтервалів  , то по даній функції  ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції  з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей   такий, що  . Критерій   призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}

Правило критерію ред.

Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.


Теорема Пірсона ред.

Якщо вірна гіпотеза H1', то при фіксованому k й при  :  

де, нагадаємо,  є  -розподіл зі   ступенем вільності.

Зауваження ред.

Насправді критерій   застосовують і для розв'язку первісного завдання про перевірку гіпотези  . Необхідно тільки пам'ятати, що цей критерій недостатній для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в  . Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.

Критерій Пірсона для перевірки параметричної гіпотези ред.

Критерій   часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка   з невідомого розподілу  .
Перевіряється складна гіпотеза:  ,

де   — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай   розбите на k>lінтервалів  , і   — число елементів вибірки, що потрапили в . Але ймовірність   тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення:  (2.)
Нехай  - значення параметра  , що доставляє мінімум функції   при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки   , одержимо функцію відхилення: .

Див. також ред.

Джерела ред.