Складано-ножева перевибірка: відмінності між версіями
[неперевірена версія] | [неперевірена версія] |
Вилучено вміст Додано вміст
Немає опису редагування |
Немає опису редагування |
||
Рядок 1:
Складано-ножева перевибірка або метод складеного ножа ({{Lang-en|jackknife}}) — один із методів [[Ресемплінг|ресемплінгу]] (лінійне наближення [[Статистичний бутстреп|статистичного бутстрепу]]), який використовується для оцінки похибки в [[Статистичне виведення|статистичному виведенні]]. Спосіб полягає в наступному: для кожного елементу обчислюється середнє значення вибірки без урахування даного елементу, а потім — середнє всіх таких значень. Для вибірки з n елементів оцінка розраховується шляхом обчислення середнього значення решти n-1 елементів<ref>{{Cite book|title=Прикладная статистика|last=Орлов А.И.|first=|year=2004|publisher=Издательство «Экзамен»|location=|pages=|language=російська|isbn=}}</ref>.
Один з перших алгоритмів, що був запропонований М. Кенуєм в 1949 р., полягав в тому, щоби послідовно та багаторазово виключати з наявної вибірки, яка налічує n елементів, по одному її члену та обробляти варіаційний ряд з решти (n - 1) елементів. Середнє значення, [[Дисперсія випадкової величини|дисперсія]] або медіана будуть при цьому “блукати” і тоді можна проаналізувати інформацію про кожний акт зміщення, побудувати розподіл вибіркової оцінки шуканого параметра та уточнити його властивості. Дж.
==Алгоритм методу==
Традиційні параметричні методи дозволяють оцінити точність оцінки <math>\bar{x}</math> або похибку середнього: <math>s_m=s/\sqrt{n}=\left [ \frac{1}{n(n-1)}\sum_{i=1}^n(x_i-\bar{x})^2\right ]^\tfrac{1}{2}=3.08</math>▼
▲Є вибірка X з 6 елементів {3.12; 0; 1.57; 19.67; 0.22; 2.2} зі значеннями середнього арифметичного x = 4.46 та стандартного відхилення s = 7.54.
Ту ж саму похибку середнього можна вирахувати іншим способом, відкидаючи в вихідній вибірці по одному члену, формуючи шість псевдовиборок по 5 елементів в кожній. З цих даних, в яких по черзі була виключена i-а точка, отримуємо ряд вибіркових середніх <math>\tilde{x}_{(i)}=\{4.73; 5.36; 5.04; 1.42; 5.31; 4.92\}</math> Після повного перебору всіх можливих варіантів середнє арифметичне з середніх <math>\bar{x}_{(\centerdot)}</math> буде відповідати вихідному середньому '''x = 4.46''', що можна довести алгебраїчно.<ref>{{Cite book|title=Нетрадиционные методы многомерного статистического анализа|last=Эфрон Б.|first=|year=1988|publisher="Финансы и статистика"|location=Москва|pages=50-51|language=російська|isbn=}}</ref>
▲Традиційні параметричні методи дозволяють оцінити точність оцінки <math>\bar{x}</math> або
<math>s_m=s/\sqrt{n}=\left [ \frac{1}{n(n-1)}\sum_{i=1}^n(x_i-\bar{x})^2\right ]^\tfrac{1}{2}=3.08</math>▼
==Актуальність методу==
З вищезазначеного алгоритму можна зробити висновок складеного ножа не має сенсу, коли необхідно знайти
можливе зміщення міри положення, але воно потенційно дуже корисно в багатьох інших випадках оцінки параметрів розподілу. Оскільки кожна з сформованих псеводвиборок також є підмножиною з тієї ж генеральної сукупності, то оцінка для похибки середнього, обчислена методом складеного ножа, дорівнює:
▲<math>
Таким чином, можна зробити висновок, що хоч метод складеного ножа є недоцільним, та він дозволяє відійти від традиційної параметричної теорії, що бере до уваги малий набір стандартних моделей, та не допускає узагальнень на інші параметри, крім середнього <math>\bar{x}</math>, такі як медіана, стандартна похибка, ексцес, асиметрія тощо.<ref>{{Cite book|title=Нетрадиционные методы многомерного статистического анализа|last=Эфрон Б.|first=|year=1988|publisher="Финансы и статистика"|location=Москва|pages=50-51|language=російська|isbn=}}</ref>▼
==Подальше застосування==
Популярність '''методу "складеного ножа"'''з його неефективним обчислювальним підходом при аналізі вибіркових оцінок параметрів істотно знизилася в ході розвитку ідей [[Статистичний бутстреп|бутстрепа]], коли з'явилася можливість гнучкого налаштування та використання алгоритмів самоорганізації. Разом з тим, методи складано-ножевої перевибірки знайшли в екології широке застосування для прогнозування числа "невидимих" рідкісних видів і екстраполяції видового багатства угруповань. Ідеї складного ножа отримали подальший розвиток на загальний випадок емпіричного оцінювання параметрів будь-яких моделей регресії або розпізнавання, побудованих по прецедентах, в рамках процедури крос-перевірки.<ref>{{Cite book|title=Прикладная статистика|last=Орлов А.И.|first=|year=2004|publisher=Издательство «Экзамен»|location=|pages=|language=російська|isbn=}}</ref>.
▲Таким чином можна зробити висновок, що хоч метод складеного ножа є недоцільним, та він дозволяє відійти від традиційної параметричної теорії, що бере до уваги малий набір стандартних моделей, та не допускає узагальнень на інші параметри, крім середнього <math>\bar{x}</math>, такі як медіана, стандартна похибка, ексцес, асиметрія тощо.
[[Категорія:Алгоритми]]
|