У статистиці поправка Бонферроні є методом корекції результатів тесту під час множинних порівнянь.

Історія ред.

Метод названий на честь нерівностей Бонферроні.[1] Розширення методу на довірчі інтервали було запропоновано Олівією Джин Данн.[2]

Під час проведення статистичного тесту дослідник або приймає або відхиляє нульову гіпотезу. Якщо імовірність отримати такі або ще більш відмінні різниці висока, то ми відхиляємо нульову гіпотезу. У статистиці нульова гіпотеза відхиляється якщо отримане у результаті тесту р-значення менше за становлений рівень значущості  , і отримані результати тесту вважаються значущими.

Якщо перевіряється кілька гіпотез, збільшується імовірність того, що якась группа данних, яка походить з єдиної генеральної совокупності, буде значимо відрізнятись, а отже, збільшується ймовірність неправильного відхилення нульової гіпотези (тобто, допущення помилки першого типу).[3]

Поправка Бонферроні компенсує збільшення цієї імовірності коригуючи рівень значущості:  , де   є бажаним загальним альфа-рівнем і   — кількість гіпотез.[4] Наприклад, якщо під час множинного теступання ми хочемо порівняти між собою 20 груп   з бажаним рівнем значущості  , тоді поправка Бонферроні перевірить кожну окрему гіпотезу на  . Таким чином, аби результат тесту вважався значущим, отримане p-значення має бути мешним за  .

Подібним чином рівень значущості має коригуватися при побудові кількох довірчих інтервалів.

Визначення ред.

Нехай   є сімейством гіпотез, де   є їхні відповідні p-значення, а   — кількість нульових гіпотез, і нехай   буде кількістю істинних нульових гіпотез (остання кількість є невідома досліднику). Групова ймовірність помилки першого роду (англ. family-wise error rate (FWER)) — це ймовірність відхилення принаймні одної істинно вірної нульової гупотези  . Тобто ймовірність помилки першого типу . Згідно із поправкою Бонферроні, нульова гіпотеза відхиляється для кожного  , тим самим контролюючи FWER на рівні   . Доказ цього контролю випливає з нерівності Буля наступним чином:

 

Ця корекція не потребує жодних припущень щодо незалежності p-значень або щодо кількості істинних нульових гіпотез.[5]

Довірчі інтервали ред.

Процедура, запропонована Данн, може бути використана для коригування довірчих інтервалів. При побудові   довірчих інтервалів з рівнем довіри  , новий рівень довіри має бути скоригований наступним чином:   .

Альтернативні методи ред.

Існують і інші способи контролювати помилку першого типу. Наприклад, метод Холма–Бонферроні та корекція Шидака вважаються більш потужними процедурами, ніж корекція Бонферроні.[6]

Критика ред.

Поправка Бонферроні вважається доволі консервативною при контролюванні імовірності допущення помилки першого типу під час множинних порівнянь. Коли кількість порівнюванних груп   велика, рівень значущості   знижується пропорційно кількості груп. Тим самим зменшуючи імовірність отримати значущий результат статистичного тесту.[7]

Таким чином, збільшується ймовірність отримати хибні негативні результати, що веде до зниження статистичної потужності отриманих результатів.[8]

Список літератури ред.

  1. Bonferroni, C. E., Teoria statistica delle classi e calcolo delle probabilità, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze 1936
  2. Dunn, Olive Jean (1961-03). Multiple Comparisons among Means. Journal of the American Statistical Association (англ.). Т. 56, № 293. с. 52—64. doi:10.1080/01621459.1961.10482090. ISSN 0162-1459. Процитовано 1 листопада 2023.
  3. Mittelhammer, Ron C.; Judge, George G.; Miller, Douglas J. (2000). Econometric Foundations. Cambridge University Press. с. 73—74. ISBN 978-0-521-62394-0.
  4. Miller, Rupert G. (1966). Simultaneous Statistical Inference. Springer. ISBN 9781461381228.
  5. Goeman, Jelle J.; Solari, Aldo (2014). Multiple Hypothesis Testing in Genomics. Statistics in Medicine. 33 (11): 1946—1978. doi:10.1002/sim.6082. PMID 24399688.
  6. Frane, Andrew (2015). Are per-family Type I error rates relevant in social and behavioral science?. Journal of Modern Applied Statistical Methods. 14 (1): 12—23. doi:10.22237/jmasm/1430453040.
  7. Moran, Matthew (2003). Arguments for rejecting the sequential Bonferroni in ecological studies. Oikos. 100 (2): 403—405. doi:10.1034/j.1600-0706.2003.12010.x.
  8. Nakagawa, Shinichi (2004). A farewell to Bonferroni: the problems of low statistical power and publication bias. Behavioral Ecology. 15 (6): 1044—1045. doi:10.1093/beheco/arh107.