Узагальнена дисперсія

У багатовимірній статистиці узага́льнена диспе́рсія (англ. generalized variance), на додачу до загальної дисперсії^[de], є одним з ключових показників загального розсіювання багатовимірного набору даних (з $p$ змінними $X_{j}$ ). При порівнянні узагальнених дисперсій двох різних загальних сукупностей можливо, що одна сукупність має більшу узагальнену дисперсію, ніж інша, але все ж меншу загальну дисперсію.

Узагальнену дисперсію визначають через визначник коваріаційної матриці. Поняття узагальненої дисперсії запровадив Семюел Стенлі Уілкс^[en].

Визначення ред.

Для коваріаційної матриці $\mathbf {\Sigma }$ загальної сукупності узагальнену дисперсію визначають як її визначник, тобто,^[1]

{\text{узагальнена дисперсія}}={\begin{vmatrix}\mathbf {\Sigma } \end{vmatrix}}

.

І навпаки, ви́біркову узагальнену дисперсію визначають як ${\begin{vmatrix}\mathbf {S} \end{vmatrix}}$ . В цьому випадку $\mathbf {S}$ подає ви́́біркову коваріаційну матрицю^[de].

Геометрична інтерпретація ред.

Ви́біркова узагальнена дисперсія має геометричну інтерпретацію. Розширення еліпса на понад два виміри називають гіпереліпсоїдом. p-вимірний гіпереліпсоїд $\left(\mathbf {y} -{\overline {\mathbf {y} }}\right)^{\top }\mathbf {S} ^{-1}\left(\mathbf {y} -{\overline {\mathbf {y} }}\right)=a^{2}$ з центром в ${\overline {\mathbf {y} }}$ та на основі $\mathbf {S} ^{-1}$ для стандартизації відстані до центру містить підмножину спостережень $\mathbf {y} _{1},\mathbf {y} _{2},\ldots ,\mathbf {y} _{n}$ вибірки. Еліпсоїд $\left(\mathbf {y} -{\overline {\mathbf {y} }}\right)^{\top }\mathbf {S} ^{-1}\left(\mathbf {y} -{\overline {\mathbf {y} }}\right)=a^{2}$ має осі, пропорційні квадратним кореням з власних значень ви́біркової коваріаційної матриці. Можливо показати, що об'єм цього еліпсоїда пропорційний ${\begin{vmatrix}\mathbf {S} \end{vmatrix}}^{-1/2}$ .^[1]

Примітки ред.

↑ ^а ^б Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 73. (англ.)

[Rencher73-1] а ^б Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 73. (англ.)

[1]