Пояснення та приклади
ред.
Оскільки результатом додавання , множення та множення на скаляр квадратних матриць є квадратна матриця, то можна конструювати многочлени з матриць .
Тому для довільного многочлена
f
(
x
)
=
a
0
x
k
+
a
1
x
k
−
1
+
…
+
a
k
−
1
x
+
a
k
{\displaystyle \ f(x)=a_{0}x^{k}+a_{1}x_{k-1}+\ldots +a_{k-1}x+a_{k}}
можливо розглянути вираз
f
(
A
)
=
a
0
A
k
+
a
1
A
k
−
1
+
…
+
a
k
−
1
A
+
a
k
I
,
{\displaystyle \ f(A)=a_{0}A^{k}+a_{1}A^{k-1}+\ldots +a_{k-1}A+a_{k}I,}
який є квадратною матрицею того самого порядка, що й
A
.
{\displaystyle A.}
A
=
[
0
1
2
3
]
,
p
A
(
λ
)
=
λ
2
−
3
λ
−
2.
{\displaystyle A={\begin{bmatrix}0&1\\2&3\end{bmatrix}},\quad p_{A}(\lambda )=\lambda ^{2}-3\lambda -2.}
Тоді
A
2
=
[
0
1
2
3
]
[
0
1
2
3
]
=
[
2
3
6
11
]
,
p
A
(
A
)
=
A
2
−
3
A
−
2
I
=
[
2
3
6
11
]
−
[
0
3
6
9
]
−
[
2
0
0
2
]
=
[
0
0
0
0
]
.
{\displaystyle A^{2}={\begin{bmatrix}0&1\\2&3\end{bmatrix}}{\begin{bmatrix}0&1\\2&3\end{bmatrix}}={\begin{bmatrix}2&3\\6&11\end{bmatrix}},\qquad p_{A}(A)=A^{2}-3A-2I={\begin{bmatrix}2&3\\6&11\end{bmatrix}}-{\begin{bmatrix}0&3\\6&9\end{bmatrix}}-{\begin{bmatrix}2&0\\0&2\end{bmatrix}}={\begin{bmatrix}0&0\\0&0\end{bmatrix}}.}
Доведемо теорему для матриць 2x2.
Маємо
A
=
[
a
b
c
d
]
,
p
A
(
λ
)
=
λ
2
−
(
tr
A
)
λ
+
(
det
A
)
,
{\displaystyle A={\begin{bmatrix}a&b\\c&d\end{bmatrix}},\quad p_{A}(\lambda )=\lambda ^{2}-(\operatorname {tr} A)\lambda +(\det A),}
тому
p
A
(
A
)
=
A
2
−
(
a
+
d
)
A
+
(
a
d
−
b
c
)
I
=
[
a
2
+
b
c
a
b
+
b
d
c
a
+
d
c
c
b
+
d
2
]
−
[
(
a
+
d
)
a
(
a
+
d
)
b
(
a
+
d
)
c
(
a
+
d
)
d
]
+
[
a
d
−
b
c
0
0
a
d
−
b
c
]
=
[
0
0
0
0
]
.
{\displaystyle p_{A}(A)=A^{2}-(a+d)A+(ad-bc)I={\begin{bmatrix}a^{2}+bc&ab+bd\\ca+dc&cb+d^{2}\end{bmatrix}}-{\begin{bmatrix}(a+d)a&(a+d)b\\(a+d)c&(a+d)d\end{bmatrix}}+{\begin{bmatrix}ad-bc&0\\0&ad-bc\end{bmatrix}}={\begin{bmatrix}0&0\\0&0\end{bmatrix}}.}
Якщо
A
=
diag
(
λ
1
,
…
,
λ
n
)
{\displaystyle A=\operatorname {diag} (\lambda _{1},\ldots ,\lambda _{n})}
— діагональна матриця і
f
(
x
)
{\displaystyle \ f(x)}
— поліном, то
f
(
A
)
=
diag
(
f
(
λ
1
)
,
…
,
f
(
λ
n
)
)
.
{\displaystyle f(A)=\operatorname {diag} (f(\lambda _{1}),\ldots ,f(\lambda _{n})).}
Для характеристичного полінома
p
A
(
λ
1
)
=
…
=
p
A
(
λ
n
)
=
0
,
{\displaystyle \ p_{A}(\lambda _{1})=\ldots =p_{A}(\lambda _{n})=0,}
тому одержуємо
p
A
(
A
)
=
diag
(
0
,
…
,
0
)
.
{\displaystyle p_{A}(A)=\operatorname {diag} (0,\ldots ,0).}
Позначимо через
B
{\displaystyle \ B}
союзну матрицю для характеристичної матриці
λ
I
n
−
A
.
{\displaystyle \ \lambda I_{n}-A.}
Елементи матриці В є алгебраїчними доповненнями елементів визначника
λ
I
n
−
A
,
{\displaystyle \lambda I_{n}-A,}
і тому є многочленами від λ, степені не вище n-1 .
Отже матрицю В можна представити у вигляді полінома з матричними коефіцієнтами:
B
=
∑
i
=
0
n
−
1
λ
i
B
i
.
{\displaystyle B=\sum _{i=0}^{n-1}\lambda ^{i}B_{i}.}
За властивостями союзних матриць:
B
⋅
(
λ
I
n
−
A
)
=
det
(
λ
I
n
−
A
)
I
n
=
p
(
λ
)
I
n
{\displaystyle B\cdot (\lambda I_{n}-A)=\det(\lambda I_{n}-A)I_{n}=p(\lambda )I_{n}}
Нехай:
p
(
λ
)
=
λ
n
+
λ
n
−
1
c
n
−
1
+
⋯
+
λ
c
1
+
c
0
,
{\displaystyle p(\lambda )=\lambda ^{n}+\lambda ^{n-1}c_{n-1}+\cdots +\lambda c_{1}+c_{0},}
Підставимо і отримаємо:
∑
i
=
0
n
−
1
λ
i
B
i
(
λ
I
n
−
A
)
=
λ
n
I
n
+
λ
n
−
1
c
n
−
1
I
n
+
⋯
+
λ
c
1
I
n
+
c
0
I
n
,
{\displaystyle \sum _{i=0}^{n-1}\lambda ^{i}B_{i}(\lambda I_{n}-A)=\lambda ^{n}I_{n}+\lambda ^{n-1}c_{n-1}I_{n}+\cdots +\lambda c_{1}I_{n}+c_{0}I_{n},\,}
Розкриваючи дужки і прирівнявши коефіцієнти при однакових степенях λ, одержимо:
I
n
=
B
n
−
1
{\displaystyle I_{n}=B_{n-1}\,}
c
i
I
n
=
B
i
−
1
−
B
i
⋅
A
,
0
<
i
<
n
{\displaystyle c_{i}I_{n}=B_{i-1}-B_{i}\cdot A,\qquad 0<i<n}
c
0
I
n
=
−
B
0
⋅
A
{\displaystyle c_{0}I_{n}=-B_{0}\cdot A}
Помножимо ці рівності відповідно на
A
n
,
A
n
−
1
,
…
,
I
n
{\displaystyle \ A^{n},A^{n-1},\ldots ,I_{n}}
справа і додамо. Всі члени правої частини скоротяться і ми одержимо
p
(
A
)
=
A
n
+
c
n
−
1
A
n
−
1
+
⋯
+
c
1
A
+
c
0
I
n
=
0.
{\displaystyle p(A)=A^{n}+c_{n-1}A^{n-1}+\cdots +c_{1}A+c_{0}I_{n}=0.}