Узагальнена дисперсія

У багатовимірній статистиці узага́льнена диспе́рсія (англ. generalized variance), на додачу до загальної дисперсії[de], є одним з ключових показників загального розсіювання багатовимірного набору даних (з змінними ). При порівнянні узагальнених дисперсій двох різних загальних сукупностей можливо, що одна сукупність має більшу узагальнену дисперсію, ніж інша, але все ж меншу загальну дисперсію.

Узагальнену дисперсію визначають через визначник коваріаційної матриці. Поняття узагальненої дисперсії запровадив Семюел Стенлі Уілкс[en].

Визначення ред.

Для коваріаційної матриці   загальної сукупності узагальнену дисперсію визначають як її визначник, тобто,[1]

  .

І навпаки, ви́біркову узагальнену дисперсію визначають як  . В цьому випадку   подає ви́́біркову коваріаційну матрицю[de].

Геометрична інтерпретація ред.

Ви́біркова узагальнена дисперсія має геометричну інтерпретацію. Розширення еліпса на понад два виміри називають гіпереліпсоїдом. p-вимірний гіпереліпсоїд   з центром в   та на основі   для стандартизації відстані до центру містить підмножину спостережень   вибірки. Еліпсоїд   має осі, пропорційні квадратним кореням з власних значень ви́біркової коваріаційної матриці. Можливо показати, що об'єм цього еліпсоїда пропорційний  .[1]

Примітки ред.

  1. а б Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 73. (англ.)