Коефіцієнт детермінації
Коефіцієнт детермінації (позначається як R2 — R-квадрат) — статистичний показник, що використовується в статистичних моделях як міра залежності варіації залежної змінної від варіації незалежних змінних. Іншими словами, чисельно показує, яка частина варіації залежної змінної пояснена моделлю. Вказує, наскільки отримані спостереження підтверджують модель.
В умовах класичної лінійної множинної регресії, коефіцієнт приймає значення від 0 до 1. Вважається, що чим ближче коефіцієнт до 1, тим кращою є модель. Коефіцієнт детермінації росте із кожним вступуючим до моделі предиктором (незалежною змінною). Однак, це зовсім не обов'язково зазначує перевагу моделі із більшим числом предикторів над моделлю із меншим числом предикторів. Тому, коефіцієнт детермінації має використовуватися лише як одна із метрик для посудження вірності моделі.
Формули
ред.Коефіцієнт детермінації визначається наступним чином:
де — дисперсія випадкової величини y, — умовна дисперсія залежної змінної (дисперсія похибки моделі).
Для розрахунку вибіркового коефіцієнта детермінації, використовують вибіркові оцінки значень відповідних дисперсій:
де - сума квадратів залишків регресії, — фактичні та оціночні значення пояснюваної (залежної) змінної.
— загальна сума квадратів.
- — середнє значення спостережуваних (фактичних) даних.
У випадку класичної лінійної множинної регресії (регресії з константою):
- , де — пояснена сума квадратів.
І як наслідок:
Посилання
ред.- Лінійний множинний регресійний аналіз [Архівовано 12 Січня 2013 у Wayback Machine.]
Див. також
ред.В іншому мовному розділі є повніша стаття Coefficient of determination(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою перекладу з англійської. (січень 2024)
|
Це незавершена стаття з математики. Ви можете допомогти проєкту, виправивши або дописавши її. |