Матриця Гессе

матриця других похідних

Матриця Гессеквадратна матриця елементами якої є часткові похідні деякої функції. Це поняття запровадив Людвіг Отто Гессе (1844), використовуючи іншу назву. Термін «матриця Гессе» належить Джеймсу Джозефу Сильвестрові.

Визначення

ред.

Формально, нехай дано дійсну функцію від n змінних:

 

якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гессе для цієї функції:

 

де   тобто  

Визначник цієї матриці називається визначником Гессе, або гесіаном.

Значення матриці Гессе пояснюється її появою у формулі Тейлора:

 

Матриці Гессе використовуються в задачах оптимізації методом Ньютона. Повне обчислення матриці Гессе може бути досить складним, тому були розроблені квазіньютонові алгоритми, засновані на наближених виразах для матриці Гессе. Найвідоміший з них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симетрія матриці Гессе

ред.

Мішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:

 

Це можна також записати як

 

В цьому випадку матриця Гессе є симетричною.

Критичні точки функції

ред.

Якщо градієнт   (її векторна похідна) рівний нулю в деякій точці  , то ця точка називається критичною.

  • Якщо матриця Гессе є додатно визначеною в точці  , то   — точка локального мінімуму функції  .
  • Якщо матриця Гессе є від'ємно визначеною в точці  , то   — точка локального максимуму функції  .
  • Якщо матриця Гессе не є ні додатно визначеною, ні від'ємно визначеною, причому є невиродженою (тобто  ), то  сідлова точка функції  .

Обрамлена матриця Гессе

ред.

У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гессе. Нехай знову маємо функцію:

 

але тепер також розглянемо умови:

 

При оптимізації функції f з додатковими умовами обрамлена матриця Гессе має вигляд:

 

Для даної матриці можна сформувати різні головні мінори. Позначимо   — головний мінор матриці, для якого останнім елементом на головній діагоналі є   Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.

Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів   будуть чергуватися, при чому знак   буде рівний  

Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів   мають один знак, а саме  

Варіації і узагальнення

ред.

Якщо f — векторзначна функція, тобто

 

то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.

Література

ред.