Нерівність Єнсена — зв'язує визначений інтеграл опуклої функції та значення цієї функції від інтеграла. Вона була доведена данським математиком Йоганом Єнсеном у 1906 році.[1]

Нерівність Єнсена узагальнює твердження, що січна лінія опуклої функції лежить над її графіком.
Візуалізація опуклості і нерівності Єнсена.

Враховуючи свою загальність, нерівність проявляється у багатьох формах залежно від контексту, деякі з яких представлені нижче. У найпростішому випадку нерівність стверджує, що значення опуклого перетворення є меншим або дорівнює значенню отриманого після опуклого перетворення; це простий наслідок того, що обернене твердження вірне щодо перетворень увігнутих функцій.

Нерівність Єнсена узагальнює твердження, що січна опуклої функції лежить над графіком функції (нерівність Єнсена для двох точок): січна лінія утворюється ваговими середніми значеннями опуклої функції (для ),

у той час як графік функції є опуклою функцією зважених середніх значень

Отже, нерівність Єнсена має вигляд

У контексті теорії ймовірності нерівність як правило подається у наступному вигляді: якщо випадкова величина, а — опукла функція, то

Різниця між двома частинами нерівності,

називається проміжком Єнсена [2].

ФормулюванняРедагувати

Класична форма нерівності Єнсена включає декілька чисел і вагових коефіцієнтів. Нерівність можна сформулювати у досить загальному вигляді, використовуючи або мову теорії міри, або (що еквівалентно) теорії ймовірності. У термінах теорії ймовірності нерівність можна узагальнити далі.

Дискретний випадокРедагувати

Для дійсної опуклої функції φ, та чисел   з її області визначення та додатних чисел ai, справджується:

 

нерівність міняє знак, коли φ — угнута функція:

 

Рівність виконується тоді і тільки тоді, коли   або   є лінійною на її області визначення, що містить  . Частковим випадком є

 

Позначивши   отримаємо еквівалентне формулювання:

 

де

 

За допомогою нерівності Єнсена в даному вигляді можна довести:

Інтегральне та ймовірнісне формулюванняРедагувати

Нехай  ймовірнісний простір, тобто  . Якщо   — дійснозначна функція, яка є  інтегровною,  опукла функція на дійсній прямій, тоді [3]

 

У аналізі функцій однієї змінної може знадобитися оцінка для

 

де   та   — невід'ємна функція, яка інтегровна за Лебегом. У цьому випадку міра Лебега відрізка   не обов'язково має дорівнювати одиниці. Однак, за допомогою інтегрування з використанням заміни змінних, інтервал може бути відмасштабований так, що міра дорівнюватиме одиниці. Тоді можна застосувати нерівність Єнсена і отримаємо[4]

 

Аналогічний результат можна сформулювати у термінах теорії ймовірності за допомогою простої зміни позначень. Нехай  ймовірністний простір,  інтегровна дійснозначна випадкова величина, а  опукла функція. Тоді[5]

 

У цьому ймовірнісному формулюванні міра   визначається як ймовірність  , інтеграл відносно   як математичне сподівання  , а функція   як випадкова величина  .

Зауважимо, що рівність буде мати місце тоді і лише тоді, коли   є лінійною функцією на деякій множині   такій, що   (це випливає з наведеного нижче інтегрального доведення).

Загальна нерівність в ймовірнісному формулюванніРедагувати

Більш загально, нехай   — дійсний топологічний векторний простір,   -значна інтегровна випадкова величина. У цих загальних умовах інтегровний означає, що в просторі   існує елемент  , такий, що для будь-якого елемента   із спряженого простору до простору  :   та  . Тоді для будь-якої вимірної опуклої функції   та під- -алгебри   у  -алгебрі  :

 

Тут   є умовним математичним сподіванням відносно  -алгебри  . Це загальне твердження зводиться до попередніх, якщо топологічний векторний простір   є дійсною віссю, а   є тривіальною  -алгеброю   (де  порожня множина}, а  простір елементарних подій)[6].

Уточнена та узагальнена формаРедагувати

Нехай   — одновимірна випадкова величина із математичним сподіванням   та дисперсією  . Нехай   — двічі диференційована функція, визначимо функцію

 

Тоді[7]

 

Зокрема, якщо   — опукла функція, то   і стандартний вигляд нерівності Єнсена безпосередньо випливає, якщо додатково вважати функцію   двічі диференційованою.

ДоведенняРедагувати

 
Графічне доведення нерівності Єнсена для ймовірнісного випадку. Пунктирна крива вздовж осі   є гіпотетичним розподілом  , тоді як пунктирна крива вздовж осі   є відповідним розподілом значень  . Зауважимо, що опукле відображення   дедалі більше ``розтягує розподіл для збільшення значень  .
 
Доведення нерівності Єнсена для   змінних без слів. Без втрати загальності вважаємо, що сума додатних вагових коефіцієнтів дорівнює 1. Звідси випливає, що вагома точка знаходиться в опуклій оболонці вихідних точок, яка лежить над самою функцією за означенням опуклості. Звідси випливає відповідне твердження.[8]

Нерівність Єнсена можна довести декількома способами, і нижче буде запропоновано три різні доведення, що відповідають вищезазначеним твердженням. Однак перед тим як приступати до цих математичних доведень варто проаналізувати інтуїтивно зрозумілий графічний аргумент на основі ймовірнісного випадку, де   є дійсним числом (див. рисунок). Припускаючи гіпотетичний розподіл значень  , можна одразу визначити положення математичного сподівання   та його образу   на графіку. Враховуючи, що для опуклих відображень   відповідний розподіл значень   є зростаючим і розтягується при зростаючих значеннях  , легко зрозуміти, що розподіл   є ширшим в інтервалі, що відповідає   і вужчим при   для будь-якого  . Зокрема, це також справедливо для  .

Отже, на цьому рисунку математичне сподівання для   завжди зміщуватиметься вгору по відношенню до положення  . А налогічне міркування справедливе, якщо розподіл   охоплює спадну частину опуклої функції, або одночасно спадну і зростаючу його частини. Це доводить нерівність, тобто

 

яка перетворюється у рівність, якщо   не є строго опуклою функцією, наприклад, якщо вона є прямою, або, якщо   має вироджений розподіл (тобто є константою).

Наведені нижче доведення формалізують це інтуїтивне поняття.

Доведення 1 (дискретна форма)Редагувати

Якщо   і   — два довільні невід'ємні дійсні числа такі, що  , то з опуклості   випливає

 

Цю нерівність можна легко узагальнити: якщо   — невід'ємні дійсні числа такі, що  , тоді

 

для будь-яких  . Цю скінченну форму нерівності Єнсена можна довести за допомогою методу математичної індукції: за припущення опуклості твердження справедливе для  . Припустимо, що воно справедливе і для деякого  , потрібно довести нерівність для  . Щонайменше одне з   є додатним і строго меншим 1, нехай  ; тоді з означення опуклості:

 

Оскільки

 

то можна застосувати індукційні гіпотези до останнього члена в попередній формулі для того, щоб отримати результат, а саме кінцеву форму нерівності Єнсена.

Для того, щоб отримати загальну нерівність з цієї кінцевої форми, необхідно використовувати аргумент щільності. Скінченну форму можна переписати як

 

де   — міра, що задається довільною опуклою комбінацією дельта-функцій Дірака:

 

Оскільки опуклі функції є неперервними, й опуклі комбінації дельта-функцій Дірака є слабко щільними в множині ймовірнісних мір (що можна легко перевірити), то загальне твердження отримується легко за допомогою граничного переходу.

Доведення 2 (інтегральне формулювання)Редагувати

Нехай   — дійснозначна  -інтегровна функція у ймовірностному просторі  , а   — опукла дійснозначна функція. Оскільки   опукла, то для кожного дійсного значення   маємо непусту множину субдиференціалів, які можна розглядати як лінії, що дотикаються до графіка функції   в точці  , але які знаходяться над графіком функції   або нижче нього у всіх точках (опорні лінії графіка).

Тепер, якщо визначимо

 

то внаслідок існування субдиференціалів для опуклих функцій можемо вибрати   та   такі, що

 

для всіх дійсних   і   Але тоді маємо, що   для всіх  . Оскільки маємо ймовірнісну міру, то інтеграл є монотонним з  , так що

 

що й треба було довести.

ЗауваженняРедагувати

Якщо функція   угнута (опукла догори), то знак в нерівності змінюється на протилежний.

ПриміткиРедагувати

  1. Jensen, J. L. W. V. (1906). Sur les fonctions convexes et les inegalites entre les valeurs moyennes. Acta Mathematica 30 (1): 175–193. doi:10.1007/BF02418571. 
  2. Gao, Xiang; Sitharam, Meera; Roitberg, Adrian (2019). Bounds on the Jensen Gap, and Implications for Mean-Concentrated Distributions. The Australian Journal of Mathematical Analysis and Applications 16 (2). arXiv:1712.05267. 
  3. p. 25 of Rick Durrett (2019). Probability: Theory and Examples (вид. 5th). Cambridge University Press. ISBN 978-1108473682. 
  4. Niculescu, Constantin P. "Integral inequalities", P. 12.
  5. p. 29 of Rick Durrett (2019). Probability: Theory and Examples (вид. 5th). Cambridge University Press. ISBN 978-1108473682. 
  6. Attention: In this generality additional assumptions on the convex function and/ or the topological vector space are needed, see Example (1.3) on p. 53 in Perlman, Michael D. (1974). Jensen's Inequality for a Convex Vector-Valued Function on an Infinite-Dimensional Space. Journal of Multivariate Analysis 4 (1): 52–65. doi:10.1016/0047-259X(74)90005-0. 
  7. Liao, J.; Berg, A (2018). Sharpening Jensen's Inequality. American Statistician. arXiv:1707.08644. doi:10.1080/00031305.2017.1419145. 
  8. Bradley, CJ (2006). Introduction to Inequalities. Leeds, United Kingdom: United Kingdom Mathematics Trust. с. 97. ISBN 978-1-906001-11-7. 

Див. такожРедагувати

ЛітератураРедагувати