Тест Грабса

У статистиці, тест Грабса (названий на честь Френка Е. Грабса, який опублікував тест у 1950 р.^[1]), також відомий як максимальний нормалізований тест залишків або екстремальний стюдентізований тест відхилень є тестом, який використовується для виявлення викидів у одномірному наборі даних, який передбачається надходити з нормально розподіленої сукупності.

Визначення ред.

Тест Грабса базується на припущенні нормальності . Тобто перед застосуванням тесту Грабса слід спочатку перевірити, чи дані можна розумно апроксимувати нормальним розподілом.^[2]

Тест Грабса виявляє по одному викиду за раз. Цей викид видаляється з набору даних, і тест повторюється, поки не буде виявлено викидів. Однак багаторазові ітерації змінюють ймовірність виявлення, і тест не слід використовувати для вибірок розмірами в шість значень чи менше, оскільки він часто позначає більшість точок як викиди.^[3]

Тест Грабса визначається для гіпотези :

H₀ : У наборі даних немає викидів

H_a : У наборі даних є лише один викид

Статистичні дані тесту Грабса визначаються як:

G={\frac {\displaystyle \max _{i=1,\ldots ,N}\left\vert Y_{i}-{\bar {Y}}\right\vert }{s}}

де ${\overline {Y}}$ та $s$ що позначає середнє значення вибірки та стандартне відхилення відповідно. Статистика випробування Грабса — це найбільше абсолютне відхилення від середнього значення вибірки в одиницях стандартного відхилення вибірки.

Це двосторонній тест, для якого гіпотеза про відсутність викидів відкидається на рівні значущості α, якщо

G>{\frac {N-1}{\sqrt {N}}}{\sqrt {\frac {t_{\alpha /(2N),N-2}^{2}}{N-2+t_{\alpha /(2N),N-2}^{2}}}}

де t _{α/(2 N), N −2,} позначає верхнє критичне значення t-розподілу з N - 2 ступенями свободи та рівнем значущості α/(2 N).

Односторонній випадок ред.

Тест Грабса можна також задати як односторонній тест, замінивши α/(2N) на α/N. Щоб перевірити, чи є мінімальне значення викидом, обчислюється значення статистики тесту :

G={\frac {{\bar {Y}}-Y_{\min }}{s}}

де Y _min, що позначає мінімальне значення. Щоб перевірити, чи є максимальне значення викидом, обчислюється значення статистики тесту:

G={\frac {Y_{\max }-{\bar {Y}}}{s}}

де Y _max позначає максимальне значення.

Споріднені методи ред.

Для виявлення викидів можна і варто використовувати деякі графічні методи. Простий графік послідовності виконання, діаграма розмаху або гістограма повинні показувати будь-які очевидно віддалені точки. Графік нормального розподілу ймовірностей також може допомогти у вирішенні цієї задачі.

Див. також ред.

Примітки ред.

↑ Grubbs, Frank E. (1950). Sample criteria for testing outlying observations. Annals of Mathematical Statistics. 21 (1): 27—58. doi:10.1214/aoms/1177729885.
↑ Quoted from the Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
↑ Adikaram, K. K. L. B.; Hussein, M. A.; Effenberger, M.; Becker, T. (14 січня 2015). Data Transformation Technique to Improve the Outlier Detection Power of Grubbs' Test for Data Expected to Follow Linear Relation. Journal of Applied Mathematics (англ.). 2015: 1—9. doi:10.1155/2015/708948.{{cite journal}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)

Додаткова література ред.

Grubbs, Frank (February 1969). Procedures for Detecting Outlying Observations in Samples. Technometrics. Technometrics, Vol. 11, No. 1. 11 (1): 1—21. doi:10.2307/1266761. JSTOR 1266761.
Stefansky, W. (1972). Rejecting Outliers in Factorial Designs. Technometrics. Technometrics, Vol. 14, No. 2. 14 (2): 469—479. doi:10.2307/1267436. JSTOR 1267436.

[1] Grubbs, Frank E. (1950). Sample criteria for testing outlying observations. Annals of Mathematical Statistics. 21 (1): 27—58. doi:10.1214/aoms/1177729885.

[2] Quoted from the Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm

[3] Adikaram, K. K. L. B.; Hussein, M. A.; Effenberger, M.; Becker, T. (14 січня 2015). Data Transformation Technique to Improve the Outlier Detection Power of Grubbs' Test for Data Expected to Follow Linear Relation. Journal of Applied Mathematics (англ.). 2015: 1—9. doi:10.1155/2015/708948.{{cite journal}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)

[1]

[2]

[3]