Широкий і вузький формат даних

Широкий і вузький (іноді неукладений і укладений, або широкий і високий) – це терміни, які використовуються для опису двох різних представлень табличних даних.[1][2]

Широкий ред.

Широкі дані або дані без укладання подані таким чином, що кожна змінна даних має окремий стовпчик.

Особа Вік Вага Зріст
Боб 32 168 180
Аліса 24 150 175
Стів 64 144 165

Вузький ред.

Вузькі, складені або довгі дані подані таким чином, що є один стовпчик, що містить усі значення, та інший, де подано контекст значення.

Особа Змінна Значення
Боб Вік 32
Боб Вага 168
Боб Зріст 180
Аліса Вік 24
Аліса Вага 150
Аліса Зріст 175
Стів Вік 64
Стів Вага 144
Стів Зріст 165

Такий формат часто простіше реалізувати: додавання нового поля не потребує будь-яких змін у структурі таблиці, проте для людей розуміння такої таблиці може бути ускладненим.

Реалізація ред.

Багато статистичних систем і систем обробки даних мають функції для перетворення між цими двома форматами, наприклад, мова програмування R має кілька пакетів, таких як пакет tidyr. [Архівовано 24 грудня 2021 у Wayback Machine.] Пакет pandas у Python реалізує цю операцію як функцію melt [Архівовано 4 грудня 2021 у Wayback Machine.], яка перетворює широку таблицю у вузьку. Процес перетворення вузької таблиці в широку таблицю зазвичай називають «поворотом» (англ. pivoting) у контексті перетворень даних. Пакет Python "pandas" містить метод "pivot" [Архівовано 4 грудня 2021 у Wayback Machine.], який забезпечує перетворення вузької таблиці на широку.

Див. також ред.

Примітки ред.

  1. Thompson, M. E.[en] (1997), Theory of sample surveys, Chapman & Hall, London. ISBN 0-412-31780-X
  2. Chantala, K. (2006) "Using STATA to Analyze data from a Sample Survey" [Архівовано 20 вересня 2008 у Wayback Machine.]. 1-10-2001. UNC Chapel Hill, Carolina Population Center. 10-1-2006.

Посилання ред.