Користувач:Yura Kuch/Біноміальний розподіл Пуассона

Біноміальний розподіл Пуассона
Параметри — ймовірності успіху для кожного з випробувань
Носій функції
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнє
Медіана {{{median}}}
Мода {{{mode}}}
Дисперсія
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія {{{entropy}}}
Твірна функція моментів (mgf)
Характеристична функція {{{char}}}

У теорії ймовірностей та статистиці біноміальний розподіл Пуассона є дискретним ймовірнісним розподілом суми незалежних випробувань Бернуллі, які не обов'язково мають однаковий розподіл. Концепція отримала назву на честь Сімеона Дені Пуассона.

Інакше кажучи, це ймовірнісний розподіл кількості успіхів у колекції з незалежних експериментів з можливими відповідями "так" або "ні" та імовірностями успіху . Звичайний біноміальний розподіл є спеціальним випадком біноміального розподілу Пуассона, коли всі ймовірності успіху однакові, тобто .

Визначення

ред.

Функція ймовірностей

ред.

Імовірність   успішних випробувань із загальної кількості   можна записати у вигляді суми [1]

 ,

де   - це множина всіх підмножин з   , вибрані з колекції  . До прикладу розглянемо випадок, якщо   =  , тоді  .   є доповненням до  , тобто   .

Множина   міститиме  елементів. Цю суму не можливо обчислити на практиці, якщо кількість випробувань   мала (наприклад, якщо   =  ,   містить понад    елементів). Однак існують інші, більш ефективні способи обчислення   .

Поки жодна з ймовірностей успіху дорівнюватиме одиниці, обчислити ймовірність   успіхів можливо за рекурсивною формулою [2] [3]

 ,

де

 

Рекурсивна формула не є чисельно стійкою, тому, якщо кількість випробувань   перевищувати   їй треба шукати заміну. Альтернативою може стати використання алгоритму «розділяй і володарюй»: якщо ми припустимо, що   є степенем двійки, тоді позначивши через   біном Пуассона  , а оператор згортки через  , маємо наступне:   .

Іншою можливістю є використання дискретного перетворення Фур'є . [4]

 ,

де   і   .

Існують й інші методи обчислення ймовірностей описані в «Статистичних застосуваннях біноміального Пуассона та умовного розподілу Бернуллі» Чена та Лю. [5]

Кумулятивна функція розподілу

ред.

Кумулятивну функцію розподілу (CDF) можна виразити як:

 ,

де   — це множина всіх підмножин розміру 𝑙, які можна вибрати з колекції  .

Властивості

ред.

Середнє значення та дисперсія

ред.

Оскільки змінна, що розподілена за законом біноміального розподілу Пуассона, є сумою   незалежних змінних, що розподілені за законом Бернуллі, її середнє значення та дисперсія будуть просто сумою середнього значення та дисперсії цих   розподілених змінних Бернуллі:

 ,
 .

Для фіксованого середнього ( ) та розміру ( ), дисперсія максимальна, коли всі ймовірності успіху однакові (біноміальний розподіл). Коли середнє значення фіксоване, дисперсія обмежена зверху дисперсією розподілу Пуассона з тим самим середнім значенням, яке досягається асимптотично при наближенні   до нескінченності.

Нерівність Чернова

ред.

Ймовірність того, що біноміальний розподіл Пуассона стає великим, може бути обмежена за допомогою його функції згортки моментів наступним чином (дійсна, коли   і для будь-якого   ):

 

де   . Подібно до хвостових меж біноміального розподілу .

Обчислювальні методи

ред.

За посиланням [6] наведене обговорення методу оцінки функції маси ймовірності біноміального розподілу Пуассона. На ньому базуються наступні програмні реалізації:

  • Пакет R poibin був наданий разом із документом [6], який доступний для обчислення cdf, pmf, квантильної функції та генерації випадкових чисел біноміального розподілу Пуассона. Для обчислення PMF можна вказати алгоритм DFT або рекурсивний алгоритм для обчислення точного PMF, а також можна вказати методи апроксимації з використанням нормального розподілу та розподілу Пуассона.
  • poibin — реалізація Python — може обчислювати PMF і CDF, для цього використовує метод DFT, описаний у статті.

Дивись також

ред.

Список літератури

ред.
  1. Wang, Y. H. (1993). On the number of successes in independent trials (PDF). Statistica Sinica. 3 (2): 295—312.
  2. Shah, B. K. (1994). On the distribution of the sum of independent integer valued random variables. American Statistician. 27 (3): 123—124. JSTOR 2683639.
  3. Chen, X. H.; A. P. Dempster; J. S. Liu (1994). Weighted finite population sampling to maximize entropy (PDF). Biometrika. 81 (3): 457. doi:10.1093/biomet/81.3.457.
  4. Fernandez, M.; S. Williams (2010). Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 46 (2): 803—817. Bibcode:2010ITAES..46..803F. doi:10.1109/TAES.2010.5461658.
  5. Chen, S. X.; J. S. Liu (1997). Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 7: 875—892.
  6. а б Hong, Yili (March 2013). On computing the distribution function for the Poisson binomial distribution. Computational Statistics & Data Analysis. 59: 41—51. doi:10.1016/j.csda.2012.10.006. Помилка цитування: Некоректний тег <ref>; назва «hong2013» визначена кілька разів з різним вмістом

[[Категорія:Факторіали і біноміальні коефіцієнти]] [[Категорія:Дискретні розподіли]]