Відкрити головне меню

Математи́чне сподіва́ння, математи́чне очікування[1] середнє значення — одна з основних числових характеристик кожної випадкової величини. Воно є узагальненим поняттям середнього значення сукупності чисел на той випадок, коли елементи множини значень цієї сукупності мають різну "вагу", ціну, важливість, пріоритет, що є характерним для значень випадкової змінної. [2] В теорії ймовірностей, математичне сподівання випадкової величини, інтуїтивно, є середнім значенням при довгостроковому повторенні одного і того ж експеримента, який воно представляє. Наприклад, математичне сподівання при підкидання шестигранної гральної кісточки становить 3,5, оскільки середнє значення з усіх чисел, які можуть випасти становить 3,5 із тим як кількість підкидань прямує до нескінченності. Іншими словами, закон великих чисел стверджує, що середнє арифметичне всіх значень майже певно збігається до математичного сподівання, із тим як кількість повторів даного експерименту прямує до нескінченності. Математичне сподівання також іноді називають сподіванням, середнім, середнім значенням, або першим моментом.

Оскільки, випадкова величина може бути дискретною або задана густиною розподілу ймовірностей, тому теорія ймовірностей наводить два означення математичного сподівання. У більш практичному розумінні, математичне сподівання дискретної випадкової величини є середнім зваженим по імовірності для всіх можливих значень. Іншими словами, кожне можливе значення випадкової величини фактично є помножене на його імовірність виникнення, і отриманий добуток складається у загальну суму, яка утворює математичне сподівання. Той самий принцип застосовується і для абсолютно неперервних випадкових величин, за винятком того, що сума замінюється на інтеграл для даної випадкової величини, по відношенню до її функції густини імовірностей. Формальне визначення включає у себе обидва ці випадки, а також передбачає розподіли, які не є ні дискретними ні абсолютно неперервними; математичне сподівання випадкової величини є інтегралом аргументом якого є ця випадкова величина відповідно до її міри імовірності.[3][4]

Математичне сподівання не існує для випадкових величин, що мають певні розподіли імовірностей із великими "хвостами"[en], як наприклад, Розподіл Коші.[5] Для таких випадкових величин, довгий хвіст розподілу не передбачає, що сума або інтеграл будуть збіжними.

Математичне сподівання є ключовим аспектом, який характеризує розподіл ймовірностей; воно є одним із різновидів коефіцієнта зсуву. На противагу йому, дисперсія є мірою розсіяння можливих значень випадкової величини довкола математичного сподівання. Дисперсія сама по собі визначається в термінах двох математичних сподівань: це математичне сподівання квадратичного відхилення значень випадкової величини від математичного сподівання.

Зміст

Означення 1Редагувати

Нехай дискретна випадкова змінна   може набувати значення   відповідно з ймовірностями   причому  .

  • Означення Чебишова: Математичним сподіванням будь-якої величини називається сума всіх можливих для неї значень, помножених на їхні ймовірності: [6]
 ,

де

  — це середнє значення випадкової величини  , областю можливих значень якої є множина  ;
 оператор математичного сподівання;
  — математичне сподівання величини  .

ТвердженняРедагувати

  • Оскільки всі ймовірності   додані разом дорівнюють 1 ( ), математичне сподівання є середнім зваженим, де   є ваговими коефіцієнтами. [7]
 

Якщо всі події   є рівноймовірними[en] (так що,  ), тоді зважене середнє перетворюється у просте середнє арифметичне. Інтуїтивно це можливо зрозуміти наступним чином: очікуване значення випадкової величини є середнім по всім значенням, які вона може прийняти; таким чином сподіванням є таким значенням, що очікують трапиться в середньому. Якщо події   трапляються не з однаковими ймовірностями, тоді просте середнє необхідно замінити зваженим середнім, що дозволяє врахувати, що деякі події трапляються частіше ніж інші. Інтуїтивне розуміння тим не менш залишається тим самим: математичним сподіванням випадкової величини   є те значення, яке повинне трапитися в середньому.

 
Ілюстрація збіжності середнього для послідовності кидання гральної кістки до сподівання 3.5 при постійному збільшенні кількості спроб.

ПрикладиРедагувати

  • Нехай   задає множину подій при підкиданні гральної кістки із шістьма сторонами. Результатом буде кількість точок на верхній грані після підкидання гральної кістки. Можливими значеннями, які прийматиме   є 1, 2, 3, 4, 5, і 6, всі є рівноймовірними (кожне значення має ймовірність 16). Математичним сподіванням для   буде
 
Якщо підкинути гральну кістку   разів і розрахувати середнє (середнє арифметичне) всіх результатів, із збільшенням  , середнє буде майже певне збігатися до значення сподівання. Цей факт відомий як закон великих чисел. Одним із прикладів послідовності десяти випадань гральної кістки є 2, 3, 1, 2, 5, 6, 2, 2, 2, 6, для якого середнє буде дорівнювати 3.1, що відрізняється від математичного сподівання 3.5 на число 0.4. Зближення є відносно повільним: ймовірність що середнє знаходитиметься в межах 3.5 ± 0.1 дорівнює 21.6% для десяти спроб, 46.1% для сотні спроб і 93.7% для тисячі спроб. Див. графік на якому показані середні для довших послідовностей кидання гральної кістки на якому видно як вони збігаються до математичного сподівання із значенням в 3.5. У загальному випадку, швидкість зближення можна приблизно розрахувати за допомогою, наприклад, нерівності Чебишова і теореми Беррі-Ессіна[en].
  • При грі в рулетку невелика кулька може потрапити в одну із 38 пронумерованих секцій колеса, що розміщені по колу. Коли колесо розкручують кулька ударяється і рухається випадковим чином доки не зупиниться в одному з секторів. Нехай випадкова величина   задає (грошовий) виграш при ставці в $1 на одне число ("пряма" ставка). Якщо ставка виграє (що трапиться із ймовірністю 138), виграш становитиме $35; в іншому випадку гравець втрачає ставку. Очікуваним прибутком від такої ставки буде
 
Тобто, ставка в $1 коштуватиме втраті $0.0526, точніше її сподіванням є -$0.0526.

Означення 2Редагувати

Нехай випадкова змінна   задана густиною розподілу ймовірностей :  ,  .

  • Математичним сподіванням такої числової змінної  , якщо воно існує, називають інтеграл, узятий по області існування її густини розподілу, від добутку цієї випадкової змінної на її густину розподілу, тобто:
 .

Сподівання існує, якщо цей інтеграл абсолютно збіжний.

Ймовірність середнього значенняРедагувати

 

Деякі формули для обчислення математичного сподіванняРедагувати

Абстрактний інтеграл, що фігурує в означенні математичного сподівання, можна замінити відповідним інтегралом Лебега-Стілтьєса. Розглянемо випадок композиції борелівської функції   та випадкової величини   :

 ,

де   — функція розподілу випадкової величини  .

Від цієї залежності приходимо до такої формули:

 

Основні властивості математичного сподіванняРедагувати

  1. Якщо   та   — незалежні інтегровні випадкові величини, то  .
  2. Якщо   та   — інтегровні випадкові величини, то  .
  3. Якщо   — інтегровна випадкова величина,   то  .

Нижченаведені властивості повторюють властивості інтеграла Лебега, або безпосередньо випливають із них.

 Редагувати

Якщо   є випадковою подією, тоді   де   це індикаторна функція для множини  .

Доведення. За визначенням інтеграла Лебега для простої функції  ,

 

Якщо X = Y тоді E[X] = E[Y]Редагувати

Це твердження випливає із визначення інтеграла Лебега, якщо взяти до уваги, шо  ,  , і що заміна простої випадкової величини на множину із нульовою імовірністю не змінює математичного сподівання.

Математичне сподівання для сталоїРедагувати

Якщо   це випадкова величина, і  , де  , тоді  . Зокрема, для довільної випадкової величини  ,  .

ЛінійністьРедагувати

Оператор математичного сподівання   є лінійним в тому сенсі, що

 

де   і   є (довільними) випадковими величинами, і   є скаляром.

Більш суворо, нехай   і   - випадкові величини, які мають визначені математичні сподівання (що відмінні від  ).

  • Якщо   також визначене (тобто відмінне від  ), тоді
 
  • нехай   є скінченним, а   є скінченним скаляром. Тоді  

E[X] існує і є скінченним тоді і тільки тоді, коли E[|X|] є скінченнимРедагувати

Наступні твердження відносно випадкової величини   - еквівалентні:

  •   існує і є скінченним.
  • Обидва   і   є скінченними.
  •   скінченне.

Насправді,  . Відповідно до властивості лінійності,  . Вищенаведена рівність спирається на визначення інтегралу Лебега і вимірність  .

Завдяки цьому, вирази про те що "  є інтегрованою" і "математичне сподівання   є скінченним" є зрештою взаємозамінними, якщо говорять про випадкову величину.

Якщо X ≥ 0 тоді E[X] ≥ 0Редагувати

МонотонністьРедагувати

Якщо   (a.s.), і обидва   та   існують, тоді  .

Зауваження.   and   існую в тому розумінні, що   and  

Доведення випливає із властивості лінійності і попередньої властивості, якщо задати   і звернути увагу на те, що   (майже скрізь).

Якщо   (майже скрізь) і   є скінченною, тоді так само і для  Редагувати

Нехай   і   є випадковими величинами, такими що   (майже скрізь) і  . Тоді  .

Доведення. Завдяки не від'ємності  ,   існує, скінченне або нескінченне. Відповідно до властивості монотонності,  , тож   є скінченним, що в свою чергу як ми бачили буде еквівалентне тому, що   є скінченним.

Якщо   та   тоді  Редагувати

Нижченаведене твердження буде використане для доведення властивості екстремальності для  .

Твердження. Якщо   є випадковою величиною, тоді так само буде і  , для будь-якого  . Якщо в додаток до того,   і  , тоді  .

Доведення.
Аби зрозуміти чому перше твердження є справедливим, зауважимо, що   є композицією із   та  . Оскільки це буде композицією двох вимірних функцій, то   також є вимірною.

Аби довести друге твердження, визначимо

 

Можна перевірити, що   є випадковою величиною і  . Відповідно до властивості невід'ємності,

 

Відповідно до властивості монотонності,

 

Протилежний приклад для нескінченної міриРедагувати

Вимога, що   є суттєвою. Як протилежний приклад розглянемо вимірний простір

 

де   це Борелівська  -алгебра над інтервалом   і   є лінійною мірою Лебега. Можна довести, що   навіть якщо   (  і   визначають міру   над   Зважаючи на неперервність для   і спростивши інтеграл Рімана для кожного скінченного інтервала  ), отримаємо необхідне доведення.

Властивість екстремальностіРедагувати

Відповідно до того, що було доведено вище, якщо   це випадкова змінна, тоді так само і  .

Твердження (властивість екстремальності для  ). Нехай   є випадковою величиною, і  . Тоді   і   є скінченними, а   найкраща апроксимація методом найменших квадратів для   серед сталих. Зокрема,

  • для кожного  ,  
  • рівняння буде дійсним тоді і тільки тоді, коли  

(  позначає дисперсію величини  ).

Пояснення (інтуїтивно зрозуміла інтерпретація властивості екстремальності). У простому розумінні, властивість екстремальності стверджує, що якщо існує задача передбачення результату[en] випробування для випадкової величини  , тоді  , в деякому практичному сенсі, є найкращим закладом (передбачення) якщо немає попередньої інформації про результат. З іншого боку, якщо в результаті отриманого результату існує деяке уточнене знання  , тоді — знов, в деякому практичному сенсі — передбачення можна покращити використовуючи умовні математичні сподівання   (серед яких   є особливим випадком) замість  .

Доведення твердження. Відповідно до попередніх властивостей,   і   обидва є скінченними, і

 

звідки випливає властивість екстремальності.

НевиродженістьРедагувати

Якщо  , тоді   (майже певно).

Якщо   тоді   (майже певно)Редагувати

Наслідок: якщо   тоді   (майже певно)Редагувати

Наслідок: якщо   тоді   (майже певно)Редагувати

 Редагувати

Для довільної випадкової величини буде вірною властивість  ,  .

Доведення. Відповідно до визначення інтеграла Лебега,

 

Відмітимо, що цей самий результат можна довести за допомогою нерівності Єнсена.

НемультиплікативністьРедагувати

В загальному випадку, оператор математичного сподівання не є мультиплікативним, тобто   не обов'язково дорівнюватиме  . Насправді, нехай   приймає значення 1 та -1 із імовірністю 0.5 кожне. Тоді

 

і

 

Величина, на яку відрізняється мультиплікативність називається коваріацією:

 

Однак, якщо випадкові величини   і   є незалежними, тоді  , та  .

Протилежний приклад:   незважаючи на це   поточковоРедагувати

Нехай   задає ймовірнісний простір, де   є Борелівською  -алгеброю над   і   є лінійною мірою Лебега. Для   визначимо послідовність випадкових величин

 

і випадкову величину

 

в інтервалі  , і де   є індикаторною функцією над множиною  .

Для кожного   при тому як     і

 

тож   З іншого боку,   і таким чином  

Зліченна неадитивністьРедагувати

В загальному випадку, оператор математичного сподівання не  -адитивний, тобто

 

Розглянемо обернений приклад, нехай   є ймовірнісним простором, де   це Борелівська  -алгебра у інтервалі   і   це лінійна міра Лебега. Визначимо послідовність випадкових величин   у  , де   задає індикаторну функцію над множиною  . Для поточкових сум, матимемо що

 
 

Відповідно до скінченності адитивності,

 

З іншого боку,   і тому

 

Зліченна адитивність для не від'ємних випадкових величинРедагувати

Нехай   - невід'ємні випадкові величини. Із теореми про монотонну збіжність випливає, що

 

НерівностіРедагувати

Нерівність Коші — Буняковського — ШварцаРедагувати

Нерівність Коші — Буняковського стверджує, що

 

Нерівність МарковаРедагувати

Для невід'ємної випадкової величини   та  , нерівність Маркова стверджує, що

 

Нерівність ЧебишоваРедагувати

Нехай   є довільною випадковою величиною із скінченним математичним сподіванням   і скінченною дисперсією  . Нерівність Чебишова стверджує що, для будь-якого дійсного числа  ,

 

Нерівність ЄнсенаРедагувати

Докладніше: Нерівність Єнсена

Let   є Борелівською опуклою функцією і   - випадкова величина, для якої  . Нерівність Єнсена стверджує, що

 

Примітка 1. Математичне сподівання   є добре визначеним навіть якщо   може приймати нескінченні значення. Насправді,   передбачає, що   (майже певно), тому випадкова величина   майже певно є визначеною, і таким чином є достатньо інформації для розрахунку  .

Примітка 2. Нерівність Єнсена передбачає, що   оскільки, функція абсолютного значення є опуклою.

Нерівність ЛяпуноваРедагувати

Нехай  . Нерівність Ляпунова стверджує, що

 

Доведення. Застосувавши Нерівність Єнсена до   і  , отримаємо  . Знайшовши  -ий корінь для кожної сторони отримаємо те, що необхідно було довести.

Наслідок.

 

Нерівність ГельдераРедагувати

Нехай   та   задовольняють умовам  ,  , і  . Нерівність Гельдера стверджує, що

 

Нерівність МінковськогоРедагувати

Нехай   є цілим числом, що задовольняє умові  . Крім того, нехай   і  . тоді відповідно до нерівності Мінковського,   і

 

Розрахунок границь під знаком оператора Редагувати

Теорема про монотонну збіжністьРедагувати

Нехай послідовність випадкових величин   і випадкових величин   та   визначені у одному і тому ж ймовірносному просторі   Припустимо, що

  • всі математичні сподівання     та   є визначеними (відрізняються від  );
  •  
  • для кожного  
 
  •   це поточкова границя для   (майже певно), тобто   (майже певно).

Теорема про монотонну збіжність стверджує, що

 

Лема ФатуРедагувати

Докладніше: Лема Фату

Нехай послідовність випадкових величин   і окрема випадкова величина   будуть визначені в єдиному ймовірнісному просторі   Припустимо, що

  • всі математичні сподівання     і   визначені (відрізняються від  );
  •  
  •   (м.п.), для кожного  

Лема Фату стверджує, що

 

(Зауважимо, що   є випадковою величиною, для кожного   відповідно до властивостей нижньої границі).

Наслідок. Нехай

  •   поточково (м.п.);
  •   для деякої сталої   (незалежної від  );
  •  
  •   (м.п.), для кожного  

Тоді  

Доведення виконують спостерігаючи за тим, що   (м.п.) і застосовуючи лему Фату.

Теорема про мажоровану збіжністьРедагувати

Нехай   є послідовністю випадкових величин. Якщо   поточково (м.п.),   (м.п.), та  . Тоді, відповідно до теореми про мажоровану збіжність,

  • функція від   є вимірною (hence a random variable);
  •  ;
  • всі математичні сподівання   та   є визначеними (не приймають форму  );
  •   (обидві сторони рівняння можуть бути скінченними);
  •  

Зв'язок із характеристичною функцієюРедагувати

Функція густини імовірностей   для скалярної випадкової величини   пов'язана із її характеристичною функцією   через формулу обернення:

 

Для математичного сподівання величини   (де   є функцією Бореля), ми можемо використати формулу обернення аби отримати

 

Якщо   є скінченним, змінивши порядок інтегрування і відповідно до теореми Фубіні-Тонеллі, отримаємо

 

де

 

є перетворенням Фур'є для   Вираз для   випливає напряму із теореми Планшереля[en].

Приклад випадкової величини, що не має математичного сподіванняРедагувати

Нехай випадкова величина   розподілена за законом Коші з параметрами   та   , тобто  . Ця випадкова величина має щільність:

 .

Знайдемо її математичне сподівання.

 
 .

Наявність логарифма в останньому виразі робить неможливим обчислення цього інтегралу (внаслідок необмеженості логарифма при необмеженому аргументі), що і доводить неінтегровність випадкової величини  .

ЗастосуванняРедагувати

Існує можливість побудувати таке математичне сподівання, яке буде дорівнювати імовірності події, якщо розраховувати його як математичне сподівання від індикаторної функції, яка приймає за одиницю факт виникнення події, і нуль у іншому випадку. Цей взаємозв'язок може використовуватися для застосування властивостей математичного сподівання і поширення їх до властивостей імовірностей, тобто, використовувати закон великих чисел, щоб обґрунтувати спосіб оцінки імовірностей за допомогою визначення частоти їх виникнення.

Математичні сподівання для різних степенів величини X називаються моментами величини X; центральний момент довкола середнього значення величини X це математичні сподівання степенів X − E[X]. Моменти деяких випадкових величин можуть використовуватися для визначення їх розподілів, через їх твірні функції моментів.

Для того, щоб імпіричним шляхом знайти оцінку математичного сподівання деякої випадкової величини, на основі неодноразово отриманих вимірах спостережень необхідно розрахувати середнє арифметичне значення для цих результатів. Якщо математичне сподівання існує, ця процедура дозволяє оцінити істинне математичне сподівання незміщеного виду і дозволяє мінімізувати суму квадратів залишків (суму квадратичних відстаней між спостереженнями і статистичними оцінками). Закон великих чисел демонструє (при досить м'яких умовах) що, із збільшенням розміру вибірки, дисперсія цієї статистичної оцінки зменшується.

Цю властивість використовують у дуже широкому колі різноманітних застосувань, включаючи загальні задачі теорії статистичного оцінювання та машинного навчання, що дозволяє оцінити (ймовірнісні) величини, що представляють інтерес, за допомогою методів Монте-Карло, оскільки більшість з цих величин можна представити у вигляді математичних сподівань, тобто  , де   є характеристичною функцією для множини  .

 
Масовий розподіл імовірностей збалансований довкола математичного сподівання, тут наведено Бета-розподіл Beta(α,β) із математичним сподіванням α/(α+β).

В класичній механіці, the центр мас є поняттям, яке аналогічне математичному сподіванню. Наприклад, припустимо, що X це дискретна випадкова величина, що приймає значення xi і має відповідні імовірності pi. Розглянемо невагомий стрижень, на якому здовж цього стрижня розміщені елементи ваги, в місцях розташування xi, які мають маси pi (сума яких дорівнює одиниці). Точка, в якій цей стрижень буде збалансований буде відповідати E[X].

Математичні сподівання також можна використовувати для розрахунку дисперсії, за допомогою формули розрахунку дисперсії[en]:

 

Дуже важливою областю застосування математичного сподівання є квантова механіка. Математичне сподівання для оператора квантової механіки  , що виконує операцію над вектором   квантового стану записується як  . Невизначеність для   можна розрахувати за допомогою формули  .

Див. такожРедагувати

ПриміткиРедагувати

  1. Теорія ймовірностейі математична статистика. В.Т. Швець, Одеса. Видавництво ВМВ, 2018-218с. [1]
  2. Сеньо П.С. Теорія ймовірностей та математична статистика: Підручник. — 2-ге вид., перероб. і доп. — К.: Знання, 2007. — 556 с. — ISBN 966-346-284-1.
  3. Sheldon M Ross (2007). §2.4 Expectation of a random variable. Introduction to probability models (вид. 9th). Academic Press. с. 38 ff. ISBN 0-12-598062-0. 
  4. Richard W Hamming (1991). §2.5 Random variables, mean and the expected value. The art of probability for scientists and engineers. Addison–Wesley. с. 64 ff. ISBN 0-201-40686-1. 
  5. Richard W Hamming (1991). Example 8.7–1 The Cauchy distribution. The art of probability for scientists and engineers. Addison-Wesley. с. 290 ff. ISBN 0-201-40686-1. «Sampling from the Cauchy distribution and averaging gets you nowhere — one sample has the same distribution as the average of 1000 samples!» 
  6. Чебышев П.Л. Полное собрание сочинений. — Математический анализ. — М.- Л., 1947. — С. 431.
  7. а б Пряха Б. Оцінювання середніх значень // Сучасні досягнення геодезичної науки та виробництва, 2007, випуск I(13): Зб. наук. пр. — Львів: Видавництво Національного університету "Львівська політехніка". — С. 140-145.
  8. Пряха Б.Г. Про числові характеристики результатів вимірювань // Новітні досягнення геодезії, геоінформатики та землевпорядкування — Європейський досвід. — Чернігів: ЧДІЕУ, 2008. — С. 97-108. — ISBN 978-966-2188-04-2.

ЛітератураРедагувати