Коефіціє́нт кореля́ції (англ. correlation coefficient) — це числова міра певного типу кореляції, тобто статистичного зв'язку між двома змінними.[a] Цими змінними можуть бути два стовпчики заданого набору даних спостережень, часто званого вибіркою, чи дві компоненти багатовимірної випадкової величини з відомим розподілом.[джерело?]

Існує кілька типів коефіцієнтів кореляції, кожен з власним визначенням, межами застосовності й характеристиками. Всі вони набувають значення в проміжку з −1 по +1, де ±1 вказує на найсильнішу можливу кореляцію, а 0 — на її відсутність.[2] Як інструменти аналізу, коефіцієнти кореляції стикаються з певними проблемами, включно зі схильністю деяких типів до спотворення через викиди, та можливістю неправильного використання для висновування причинно-наслідкового зв'язку між змінними (докладніше див. Корелювання не означає спричинювання).[3]

Типи ред.

Існує кілька різних мір для ступеню кореляції в даних, залежно від типу даних: головним чином, чи дані є вимірюванням, порядковими, чи категорійними.

Пірсона ред.

Коефіцієнт кореляції моменту добутку Пірсона, відомий також як r, R, або r Пірсона, є мірою сили та напрямку лінійного зв'язку між двома змінними, визначеною як коваріація змінних, поділена на добуток їхніх стандартних відхилень.[4] Це найвідоміший і найчастіше вживаний тип коефіцієнта кореляції. Коли термін «коефіцієнт кореляції» використовують без подальших уточнень, зазвичай мають на увазі коефіцієнт кореляції моменту добутку Пірсона.

Внутрішньокласова ред.

Внутрішньокласова кореляція[en] (ВКК, англ. intraclass correlation, ICC) — це описова статистика, яку можливо використовувати, коли кількісні вимірювання здійснюють над об'єктами, організованими в групи; вона описує, наскільки сильно об'єкти в одній і тій же групі схожі між собою.

Рангова ред.

Рангова кореляція — це міра взаємозв'язку між рангами двох змінних або між двома ранжуваннями однієї змінної:

Тетрахорна й поліхорна ред.

Коефіцієнт поліхорної кореляції[en] вимірює пов'язаність двох порядково-категорійних змінних. Технічно його визначають як оцінку коефіцієнта кореляції Пірсона, яку було би можливо отримати, якби:

  1. Ці дві змінні вимірювалися би на неперервній шкалі, а не як порядково-категорійні.
  2. Ці дві неперервні змінні мали би двовимірний нормальний розподіл.

Коли обидві змінні дихотомні, а не порядково-категорійні, то коефіцієнт поліхорної кореляції[en] називають коефіцієнтом тетрахорної кореляції.

Див. також ред.

Виноски ред.

  1. Коефіцієнт кореляції: Статистика, яку використовують, щоби показувати, як оцінки одного виміру пов'язані з оцінками другого виміру для тієї ж групи осіб. Високе значення (що наближається до +1,00) означає сильний прямий зв'язок, значення близько 0,50 вважають помірними, а значення нижче 0,30, як вважають, показують слабкий зв'язок. Низьке від'ємне значення (що наближається до −1,00) так само є сильним зворотним зв'язком, а значення близько 0,00 вказують на незначний або відсутній зв'язок.[1]

Примітки ред.

  1. correlation coefficient. NCME.org (англ.). National Council on Measurement in Education[en]. Архів оригіналу за 22 липня 2017. Процитовано 17 квітня 2014.
  2. Taylor, John R. (1997). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements (PDF) (англ.) (вид. 2nd). Sausalito, CA: University Science Books. с. 217. ISBN 0-935702-75-X. Архів оригіналу (PDF) за 15 лютого 2019. Процитовано 14 лютого 2019.
  3. Boddy, Richard; Smith, Gordon (2009). Statistical Methods in Practice: For scientists and technologists (англ.). Chichester, U.K.: Wiley. с. 95—96. ISBN 978-0-470-74664-6.
  4. Weisstein, Eric W. Statistical Correlation. mathworld.wolfram.com (англ.). Процитовано 22 серпня 2020.