Функція від двох змінних
ред.
Гессіан дає наближення для функції у критичній точці за допомогою многочлена другого степеня.
Припустимо, що f (x , y ) — диференційовна дійснозначима функція двох змінних чиї часткові похідні існують. Матриця Гессе H для f це 2 × 2 матриця часткових похідних f :
H
(
x
,
y
)
=
(
f
x
x
(
x
,
y
)
f
x
y
(
x
,
y
)
f
y
x
(
x
,
y
)
f
y
y
(
x
,
y
)
)
{\displaystyle H(x,y)={\begin{pmatrix}f_{xx}(x,y)&f_{xy}(x,y)\\f_{yx}(x,y)&f_{yy}(x,y)\end{pmatrix}}}
.
Нехай D (x , y ) буде її визначником :
D
(
x
,
y
)
=
det
(
H
(
x
,
y
)
)
=
f
x
x
(
x
,
y
)
f
y
y
(
x
,
y
)
−
(
f
x
y
(
x
,
y
)
)
2
{\displaystyle D(x,y)=\det(H(x,y))=f_{xx}(x,y)f_{yy}(x,y)-\left(f_{xy}(x,y)\right)^{2}}
.
Насамкінець, припустимо що (a , b ) це критична точка f (тобто, f x (a , b ) = f y (a , b ) = 0). Тоді тест другої часткової похідної стверджує таке:[ 1]
Якщо
D
(
a
,
b
)
>
0
{\displaystyle D(a,b)>0}
і
f
x
x
(
a
,
b
)
>
0
{\displaystyle f_{xx}(a,b)>0}
тоді
(
a
,
b
)
{\displaystyle (a,b)}
є локальним мінімумом f .
Якщо
D
(
a
,
b
)
>
0
{\displaystyle D(a,b)>0}
і
f
x
x
(
a
,
b
)
<
0
{\displaystyle f_{xx}(a,b)<0}
тоді
(
a
,
b
)
{\displaystyle (a,b)}
є локальним максимумом f .
Якщо
D
(
a
,
b
)
<
0
{\displaystyle D(a,b)<0}
тоді
(
a
,
b
)
{\displaystyle (a,b)}
є сідловою точкою f .
Якщо
D
(
a
,
b
)
=
0
{\displaystyle D(a,b)=0}
тоді тест другої похідної не є достатним, і точка (a , b ) може бути мінімумом, максимумом або сідловою точкою.
Скористаємось розкладенням у ряд Тейлора :
Δ
f
≃
(
x
−
x
0
)
f
x
+
(
y
−
y
0
)
f
y
+
1
2
(
x
−
x
0
)
2
f
x
x
+
(
x
−
x
0
)
(
y
−
y
0
)
f
x
y
+
1
2
(
y
−
y
0
)
2
f
y
y
.
{\displaystyle \Delta f\simeq (x-x_{0})f_{x}+(y-y_{0})f_{y}+{\frac {1}{2}}(x-x_{0})^{2}f_{xx}+(x-x_{0})(y-y_{0})f_{xy}+{\frac {1}{2}}(y-y_{0})^{2}f_{yy}.}
У критичній точці
Δ
f
{\displaystyle \Delta f}
≃
{\displaystyle \simeq }
1
2
(
x
−
x
0
)
2
f
x
x
+
(
x
−
x
0
)
(
y
−
y
0
)
f
x
y
+
1
2
(
y
−
y
0
)
2
f
y
y
{\displaystyle {\frac {1}{2}}(x-x_{0})^{2}f_{xx}+(x-x_{0})(y-y_{0})f_{xy}+{\frac {1}{2}}(y-y_{0})^{2}f_{yy}}
=
{\displaystyle =}
(
y
−
y
0
)
2
2
[
(
x
−
x
0
y
−
y
0
)
2
f
x
x
+
(
x
−
x
0
y
−
y
0
)
f
x
y
+
f
y
y
]
.
{\displaystyle {\frac {(y-y_{0})^{2}}{2}}{\bigg [}{\bigg (}{\frac {x-x_{0}}{y-y_{0}}}{\bigg )}^{2}f_{xx}+{\bigg (}{\frac {x-x_{0}}{y-y_{0}}}{\bigg )}f_{xy}+f_{yy}{\bigg ]}.}
Очевидно, що ми уникаємо точки
y
=
y
0
,
{\displaystyle y=y_{0},}
інакше це не спрацює. Тепер введемо заміну
z
=
x
−
x
0
y
−
y
0
,
{\displaystyle z={\frac {x-x_{0}}{y-y_{0}}},}
маємо
Δ
f
=
(
y
−
y
0
)
2
2
g
(
z
)
.
{\displaystyle \Delta f={\frac {(y-y_{0})^{2}}{2}}g(z).}
Оскільки
(
y
−
y
0
)
2
2
≥
0
,
{\displaystyle {\frac {(y-y_{0})^{2}}{2}}\geq 0,}
знак
Δ
f
{\displaystyle \Delta f}
повністю визначає знак
g
(
z
)
.
{\displaystyle g(z).}
Розглянемо квадратичну
(
A
≠
0
)
{\displaystyle (A\neq 0)}
функцію
g
(
x
)
=
A
x
2
+
2
B
x
+
C
.
{\displaystyle g(x)=Ax^{2}+2Bx+C.}
Якщо
A
C
−
B
2
>
0
,
{\displaystyle AC-B^{2}>0,}
і
A
>
0
{\displaystyle A>0}
або
C
>
0
,
{\displaystyle C>0,}
тоді
g
(
x
)
>
0
{\displaystyle g(x)>0}
для всіх
x
.
{\displaystyle x.}
Якщо
A
C
−
B
2
>
0
,
{\displaystyle AC-B^{2}>0,}
і
A
<
0
{\displaystyle A<0}
або
C
<
0
,
{\displaystyle C<0,}
тоді
g
(
x
)
<
0
{\displaystyle g(x)<0}
для всіх
x
.
{\displaystyle x.}
Якщо
A
C
−
B
2
<
0
,
{\displaystyle AC-B^{2}<0,}
тоді існують значення
x
{\displaystyle x}
такі, що
g
(
x
)
>
0
{\displaystyle g(x)>0}
і такі, що
g
(
x
)
<
0.
{\displaystyle g(x)<0.}
У виродженому випадку потрібен додатковий тест за допомогою вищих похідних.
Заувага, глобальний мінімум чи максимум функції не завжди є у критичній точці. Слід перевірити границі й нескінченність.
Доведення:
Нехай
A
C
−
B
2
>
0.
{\displaystyle AC-B^{2}>0.}
Якщо
A
>
0
,
{\displaystyle A>0,}
тоді
lim
x
→
∞
g
(
x
)
=
∞
,
{\displaystyle \lim _{x\rightarrow \infty }g(x)=\infty ,}
що означає, що
g
(
x
)
>
0
{\displaystyle g(x)>0}
для деякого
x
.
{\displaystyle x.}
З іншого боку, якщо
C
>
0
{\displaystyle C>0}
тоді
g
(
0
)
>
0
,
{\displaystyle g(0)>0,}
отже знов, ми знаємо, що існує
x
{\displaystyle x}
коли
g
(
x
)
>
0.
{\displaystyle g(x)>0.}
Якщо
g
{\displaystyle g}
і набуває від'ємних значень, то виходить, що
g
{\displaystyle g}
мусить десь обертатись у нуль. Ми можемо знайти коріні квадратного рівняння , тобто значення
x
{\displaystyle x}
де
g
(
x
)
=
0
:
{\displaystyle g(x)=0:}
x
=
−
2
B
±
(
2
B
)
2
−
4
A
C
2
A
=
−
B
±
B
2
−
A
C
A
.
{\displaystyle x={\frac {-2B\pm {\sqrt {(2B)^{2}-4AC}}}{2A}}={\frac {-B\pm {\sqrt {B^{2}-AC}}}{A}}.}
A
C
−
B
2
>
0
,
{\displaystyle AC-B^{2}>0,}
це значить, що
B
2
−
A
C
<
0
,
{\displaystyle B^{2}-AC<0,}
тому значення
x
{\displaystyle x}
, отримані з цієї формули, не є дійсними (бо містять ненульову уявну частину). Це означає, що
g
(
x
)
{\displaystyle g(x)}
ніколи не обертається на нуль для будь-якого
x
,
{\displaystyle x,}
отже
g
{\displaystyle g}
ніколи не перетинає вісь
x
,
{\displaystyle x,}
тому
∀
z
,
g
(
z
)
>
0.
{\displaystyle \forall z,g(z)>0.}
Цей випадок майже ідентичний попередньому.
Якщо
A
C
−
B
2
<
0
,
{\displaystyle AC-B^{2}<0,}
то
g
(
x
)
{\displaystyle g(x)}
перетинає вісь
x
{\displaystyle x}
двічі, тобто вона має як додатні так і від'ємні значення.