У статистиці, тест Грабса (названий на честь Френка Е. Грабса, який опублікував тест у 1950 р.[1]), також відомий як максимальний нормалізований тест залишків або екстремальний стюдентізований тест відхилень є тестом, який використовується для виявлення викидів у одномірному наборі даних, який передбачається надходити з нормально розподіленої сукупності.

Визначення ред.

Тест Грабса базується на припущенні нормальності . Тобто перед застосуванням тесту Грабса слід спочатку перевірити, чи дані можна розумно апроксимувати нормальним розподілом.[2]

Тест Грабса виявляє по одному викиду за раз. Цей викид видаляється з набору даних, і тест повторюється, поки не буде виявлено викидів. Однак багаторазові ітерації змінюють ймовірність виявлення, і тест не слід використовувати для вибірок розмірами в шість значень чи менше, оскільки він часто позначає більшість точок як викиди.[3]

Тест Грабса визначається для гіпотези :

H0 : У наборі даних немає викидів
Ha : У наборі даних є лише один викид

Статистичні дані тесту Грабса визначаються як:

 

де   та   що позначає середнє значення вибірки та стандартне відхилення відповідно. Статистика випробування Грабса — це найбільше абсолютне відхилення від середнього значення вибірки в одиницях стандартного відхилення вибірки.

Це двосторонній тест, для якого гіпотеза про відсутність викидів відкидається на рівні значущості α, якщо

 

де t α/(2 N), N −2, позначає верхнє критичне значення t-розподілу з N - 2 ступенями свободи та рівнем значущості α/(2 N).

Односторонній випадок ред.

Тест Грабса можна також задати як односторонній тест, замінивши α/(2N) на α/N. Щоб перевірити, чи є мінімальне значення викидом, обчислюється значення статистики тесту :

 

де Y min, що позначає мінімальне значення. Щоб перевірити, чи є максимальне значення викидом, обчислюється значення статистики тесту:

 

де Y max позначає максимальне значення.

Споріднені методи ред.

Для виявлення викидів можна і варто використовувати деякі графічні методи. Простий графік послідовності виконання, діаграма розмаху або гістограма повинні показувати будь-які очевидно віддалені точки. Графік нормального розподілу ймовірностей також може допомогти у вирішенні цієї задачі.

Див. також ред.

Примітки ред.

  1. Grubbs, Frank E. (1950). Sample criteria for testing outlying observations. Annals of Mathematical Statistics. 21 (1): 27—58. doi:10.1214/aoms/1177729885.
  2. Quoted from the Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
  3. Adikaram, K. K. L. B.; Hussein, M. A.; Effenberger, M.; Becker, T. (14 січня 2015). Data Transformation Technique to Improve the Outlier Detection Power of Grubbs' Test for Data Expected to Follow Linear Relation. Journal of Applied Mathematics (англ.). 2015: 1—9. doi:10.1155/2015/708948.{{cite journal}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)

Додаткова література ред.