Складано-ножева перевибірка: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
Немає опису редагування
Рядок 1:
'''Складано-ножева перевибірка''' або метод складеного ножа ({{Lang-en|jackknife}})&nbsp;— один із методів [[Ресемплінг|ресемплінгу]] (лінійне наближення [[Статистичний бутстреп|статистичного бутстрепу]]), який використовується для оцінки похибки в [[Статистичне виведення|статистичному виведенні]]. Спосіб полягає в наступному: для кожного елементу обчислюється [[Середнє значення|середнє значення]] вибірки без урахування даного елементу, а потім&nbsp;— середнє всіх таких значень. Для вибірки з n елементів оцінка розраховується шляхом обчислення середнього значення решти n-1 елементів.<ref>{{Cite book|title=Прикладная статистика|last=Орлов А.И.|first=|year=2004|publisher=Издательство «Экзамен»|location=|pages=|language=російська|isbn=}}</ref>.
 
Один з перших алгоритмів, що був запропонований М. Кенуєм в 1949 р., полягав в тому, щоби послідовно та багаторазово виключати з наявної вибірки, яка налічує n елементів, по одному її члену та обробляти варіаційний ряд з решти (n - 1) елементів. [[Середнє значення|Середнє значення]], [[Дисперсія випадкової величини|дисперсія]] або [[Медіана (статистика)|медіана]] будуть при цьому “блукати” і тоді можна проаналізувати інформацію про кожний акт зміщення, побудувати розподіл вибіркової оцінки шуканого параметра та уточнити його властивості. Дж. Т'юкі активно удосконалив цей метод, та назвав його "jackknife{{ref-en}}" (складений ніж), й використав для оцінки [[Дисперсія випадкової величини|дисперсії]] сукупності, що вивчається та перевірки нульової гіпотези про те, що розподіл деякої статистики є симетричним відносно заданої точки.<ref name=":0">{{Cite book|title=Рандомизация и бутстреп. Статистический анализ в биологии и экологии с использованием R. Исправленная и дополненная интернет-версия от 15.11.2013|last=В.К.Шитиков, Г.С.Розенберг|first=|year=2013|publisher=Издательство «Кассандра»|location=г. Тольятти|pages=15-17|language=російська|isbn=}}</ref>
 
==Алгоритм методу==
Дано вибірку X з 6 елементів {3.12; 0; 1.57; 19.67; 0.22; 2.2} зі значеннями [[Середнє арифметичне|середнього арифметичного]] '''x = 4.46''' та [[Стандартне відхилення|стандартного відхилення]] '''s = 7.54'''.
Традиційні параметричні методи дозволяють оцінити точність оцінки <math>\bar{x}</math> або похибку середнього: <math>s_m=s/\sqrt{n}=\left [ \frac{1}{n(n-1)}\sum_{i=1}^n(x_i-\bar{x})^2\right ]^\tfrac{1}{2}=3.08</math><br/>
Ту ж саму похибку середнього можна вирахувати іншим способом, відкидаючи в вихідній вибірці по одному члену, формуючи шість псевдовиборок по 5 елементів в кожній. З цих даних, в яких по черзі була виключена i-а точка, отримуємо ряд вибіркових середніх <math>\tilde{x}_{(i)}=\{4.73; 5.36; 5.04; 1.42; 5.31; 4.92\}</math> Після повного перебору всіх можливих варіантів [[Середнє арифметичне|середнє арифметичне]] з середніх <math>\bar{x}_{(\centerdot)}</math> буде відповідати вихідному середньому '''x = 4.46''', що можна довести алгебраїчно.<ref name=":1">{{Cite book|title=Нетрадиционные методы многомерного статистического анализа|last=Эфрон Б.|first=|year=1988|publisher="Финансы и статистика"|location=Москва|pages=50-51|language=російська|isbn=}}</ref>
 
==Актуальність методу==
Рядок 12:
можливе зміщення міри положення, але воно потенційно дуже корисно в багатьох інших випадках оцінки параметрів розподілу. Оскільки кожна з сформованих псеводвиборок також є підмножиною з тієї ж генеральної сукупності, то оцінка для похибки середнього, обчислена методом складеного ножа, дорівнює:<br/>
<math>\sigma_{jack}=\left [\frac{n}{n-1}\sum_{i=1}^n(\tilde{x}_{(i)}-\bar{x}_{(\cdot)})^2\right ]^{1/2}=3.017</math><br/>
Таким чином, можна зробити висновок, що хоч метод складеного ножа є недоцільним, та він дозволяє відійти від традиційної параметричної теорії, що бере до уваги малий набір стандартних моделей, та не допускає узагальнень на інші параметри, крім середнього <math>\bar{x}</math>, такі як [[Медіана (статистика)|медіана]], [[Стандартне відхилення|стандартна похибка]], [[Коефіцієнт ексцесу|ексцес]], [[Асиметрія|асиметрія]] тощо.<ref>{{Cite book|title=Нетрадиционные методы многомерного статистического анализа|last=Эфрон Б.|first=|year=1988|publishername="Финансы:1" и статистика"|location=Москва|pages=50-51|language=російська|isbn=}}</ref>
 
==Подальше застосування==
Популярність '''методу "складеного ножа"'''з його неефективним обчислювальним підходом при аналізі вибіркових оцінок параметрів істотно знизилася в ході розвитку ідей [[Статистичний бутстреп|бутстрепа]], коли з'явилася можливість гнучкого налаштування та використання алгоритмів самоорганізації. Разом з тим, методи складано-ножевої перевибірки знайшли в екології широке застосування для прогнозування числа "невидимих" рідкісних видів і екстраполяції видового багатства угруповань. Ідеї ​​складного ножа отримали подальший розвиток на загальний випадок емпіричного оцінювання параметрів будь-яких моделей регресії або розпізнавання, побудованих по прецедентах, в рамках процедури крос-перевірки.<ref>{{Cite book|titlename=Рандомизация":0" и бутстреп. Статистический анализ в биологии и экологии с использованием R. Исправленная и дополненная интернет-версия от 15.11.2013|last=В.К.Шитиков, Г.С.Розенберг|first=|year=2013|publisher=Издательство «Кассандра»|location=г. Тольятти|pages=15-17|language=російська|isbn=}}</ref>
 
[[Категорія:Алгоритми]]