Опукле спряження

узагальнення перетворення Лежандра, яке застосовують до неопуклих функцій

Опукле спряження функції — це узагальнення перетворення Лежандра, яке застосовується до неопуклих функцій. Воно відоме також як перетворення Лежандра — Фенхеля або перетворення Фенхеля (за іменами Адрієна-Марі Лежандра та Вернера Фенхеля[en]). Спряження використовується для перетворення задачі оптимізації у відповідну двоїсту задачу, яку, можливо, простіше розв'язати.

Визначення

ред.

Нехай   — дійсний топологічний векторний простір і нехай   — двоїстий простір для  . Позначимо двоїсту пару[en] через

 

Для функції

  ,

яка набуває значень на розширеній числовій прямій, опукле спряження

 

визначено в термінах супремуму за формулою

 

або, еквівалентно, в термінах інфімуму за формулою

 

Це визначення можна інтерпретувати як кодування опуклої оболонки надграфіка функції в термінах її опорних гіперплощин [1] [2] .

Приклади

ред.

Випукло спряження афінної функції

 

дорівнює

 

Випукло спряження степеневої функції

 

дорівнює

 

де  

Опукле спряження функції абсолютної величини

 

дорівнює

 

Опукле поєднання показникової функції   дорівнює

 

Опукле спряження і перетворення Лежандра показникової функції збігаються крім того, що область визначення опуклого спряження строго ширша, оскільки перетворення Лежандра визначено лише для додатних дійсних чисел.

Зв'язок із очікуваними втратами (середня ціна ризику)

ред.

Нехай F означає інтегральну функцію розподілу випадкової величини X. Тоді (інтегруючи частинами),

 

має опукле спряження

 

Впорядкування

ред.

Конкретна інтерпретація має перетворення

 

як неспадне перегрупування початкової функції f. Зокрема,   для   не спадає.

Властивості

ред.

Опукле спряження замкнутої опуклої функції також є замкнутою опуклою функцією. Опукле спряження поліедральної опуклої функції (опуклої функції з многогранним надграфіком) також є поліедральною опуклою функцією.

Обернення порядку

ред.

Опукле спряження обертає порядок — якщо  , то   . Тут

 

Для сімейства функцій   це випливає з факту, що супремуми можна переставляти місцями

 

та з max–min нерівність[en]

 

Подвійне спряження

ред.

Опукле спряження функції завжди напівнеперервне знизу. Подвійне спряження   (опукле спряження опуклого спряження) є також замкненою опуклою оболонкою, тобто найбільшою напівнеперервною знизу опуклою функцією з   . Для опуклих власних функцій[en]   тоді й лише тоді, коли f опукла і напівнеперервна знизу за теоремою Фенхеля ― Моро.

Нерівність Фенхеля

ред.

Для будь-якої функції f та її опуклого спряження  нерівність Фенхеля (відома також як нерівність Фенхеля — Моро) виконується для будь-якого   і   :

 

Доведення випливає негайно з визначення опуклого спряження:   .

Опуклість

ред.

Для двох функцій   і   та числа   виконується

  .

Тут операція   — це опукле відображення в себе.

Інфімальна конволюція

ред.

Інфімальна конволюція двох функцій f і g визначається як

 

Нехай f1, …, fm — правильні опуклі напівнеперервні знизу функції на  . Тоді інфімальна конволюція опукла і напівнеперервна знизу (але не обов'язково буде правильною функцією) [3] і задовольняє рівність

 

Інфімальна конволюція двох функцій має геометричну інтерпретацію — (строгий) надграфік інфімальної конволюції двох функцій дорівнює сумі Мінковського (строгих) надграфіків цих функцій[4].

Максимізувальний аргумент

ред.

Якщо функція   диференційовна, то її похідна є максимізувальним аргументом при обчисленні опуклого спряження:

  і
 

звідки

 
 

і більш того,

 
 

Масштабувальні властивості

ред.

Якщо для деякого   , то

 

У разі додаткового параметра (скажімо,  ), більш того,

 

де   вибирається максимізувальним аргументом.

Поведінка за лінійних перетворень

ред.

Нехай A — обмежений лінійний оператор з X у Y. Для будь-якої опуклої функції f на X маємо

 

де

 

є прообразом f для A, а A* — спряженим оператором для A[5].

Замкнута опукла функція f симетрична для заданої множини G ортогональних лінійних перетворень

 

тоді й лише тоді, коли опукле спряження f* симетричне для G.


Таблиця деяких опуклих спряжень

ред.

У таблиці наведено перетворення Лежандра для багатьох поширених функцій, а також для декількох корисних властивостей[6].

       
  (где  )      
       
  (где  )      
       
  (где  )     (где  )  
  (где  )     (где  )  
       
       
       
       
       

Див. також

ред.

Примітки

ред.
  1. Legendre Transform. Процитовано 14 квітня 2019.
  2. Frank Nielsen. Legendre transformation and information geometry (PDF).
  3. Phelps, 1991, с. 42.
  4. Bauschke, Goebel, Lucet, Wang, 2008, с. 766.
  5. Иоффе, Тихомиров, 1974, с. утверждение 3.4.3.
  6. Borwein, Lewis, 2006, с. 50–51.

Література

ред.
  • Robert R. Phelps. Convex Functions, Monotone Operators and Differentiability. — Springer, 1991. — ISBN 0-387-56715-1.
  • Heinz H. Bauschke, Rafal Goebel, Yves Lucet, Xianfu Wang. The Proximal Average: Basic Theory // SIAM Journal on Optimization. — 2008. — Т. 19, вип. 2. — DOI:10.1137/070687542.
  • Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М. : «Наука», 1974.
  • Jonathan Borwein, Adrian Lewis. Convex Analysis and Nonlinear Optimization: Theory and Examples. — Springer, 2006. — ISBN 978-0-387-29570-1.
  • Владимир Игоревич Арнольд. Математические методы классической механики. — М. : «Наука», 1989.
  • R. Tyrrell Rockafellar. Convex Analysis. — Princeton : Princeton University Press, 1970. — ISBN 0-691-01586-4.

Посилання

ред.