Таблиця фактів: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Немає опису редагування
Немає опису редагування
Рядок 1:
'''Таблиця фактів''' використовується у [[Сховище даних|сховищі даних]] та складається з вимірювань, показників або [[Факт|фактів]] [[Бізнес-процес| бізнес-процесу]]. Вона розташована у центрі {{не перекладено|Схема зірки|схеми зірки|en|Star schema}} або [[Схема сніжинки|схеми сніжинки]] в оточенні {{не перекладено|Розмірність (сховище даних)|таблиць розмірностей|en|Dimension table }}. Там, де використовуються декілька таблиць фактів, вона організована як {{не перекладено|Сузір'я фактів|схема сузір'я фактів|en|fact constellation schema}}. Таблиця фактів зазвичай складається з двох типів стовпців: ті, що містять факти та ті, що є [[Зовнішній ключ|зовнішнім ключем]] до таблиць розмірностей. Первинний ключ таблиці фактів зазвичай є складеним ключем, який поєднує в собі усі зовнішні ключі. Таблиці фактів містять зміст сховища даних та зберігають різні типи вимірювань, такі як адитивні, неаддитивні та півадитивні метрики.
 
Таблиці фактів надають (зазвичай) адитивні значення, які діють як незалежні змінні, за допомогою яких аналізуються атрибути розмірності. Таблиці фактів часто визначаються за їхнім «зерном». «Зерно» таблиці фактів є найбільшим атомарним рівнем, за яким ці фактори можуть бути визначені. «Зерно» таблиці фактів ПРОДАЖпродаж може бути зазначено як «Обсяг продажів відповідно до дня, продукту, магазину». Тому кожен запис цієї таблиці фактів є унікальним для дня, продукту та магазину. Інші параметри можуть бути частиною цієї таблиці фактів (наприклад, місцеположення або регіон), але вони нічого не додають до унікальності фактичних записів. Ці «партнерські параметри» дозволяють отримувати додаткові фрагменти незалежних фактів, але, як правило, забезпечують розуміння на більш високому рівні агрегації (регіон містить багато магазинів).
 
==Приклад==
Рядок 20:
* Напіваддитивні - вимірювання, які можна використати для певних величин.
 
Таблиця фактів може містити у собі або фактичні деталі, або факти, які були об'єднані (таблиці фактів, що містять сукупні факти, часто називаються таблицями підсумку).
 
Особливу увагу слід приділяти при обробці пропорцій та відсотка. Одне правильне правило дизайну<ref name="Kimball DWT">Kimball & Ross - The Data Warehouse Toolkit, 2nd Ed [Wiley 2002]</ref> полягає в тому, щоб ніколи не зберігати відсотки або пропорції у таблицях фактів, а лише обчислювати їх у інструменті доступу до даних. Таким чином, у таблицях фактів зберігається лише чисельник і знаменник, які потім можуть бути агрегованими, а збережені агреговані значення можуть потім використовуватися для обчислення пропорцій або відсотка в інструменті доступу до даних.
Рядок 27:
У реальному світі можна мати таблицю фактів, яка не містить жодних заходів чи фактів. Ці таблиці називаються "безфактними таблицями фактів" або "[[Таблиця з'єднання|таблицями з'єднання]]".
 
"Безфактні таблиці фактів" можуть, наприклад, використовуватися для моделювання відносин "багато-до-багатьох" або перехоплення подій.<ref name="Kimball DWT"/>
 
==Типи таблиць фактів==
Рядок 41:
</ref>
; Транзакційний
:ТранзакційнаТаблиця таблицятранзакцій є найбільш основною та фундаментальною. "Зерно", що пов'язане з таблицею транзакційних фактів транзакцій, як правило, визначається як "один рядок на рядок у транзакції", наприклад, кожнакожен рядок ву квитанції. Як правило, таблиця фактів транзакції містить дані самогонайбільш детального рівня, що ассоціює з собою велику кількість {{не перекладено|Вимірювання|типів міри|en|Dimension (data warehouse) }}.
; Періодичні знімки
:Періодичний знімок, як розуміється з назви, приймає "картину моменту", де момент може бути певним періодом часу, наприклад, підсумок роботи продавця за попередній місяць. Періодичний знімок таблиці залежить від таблиці транзакцій, томуоскільки що дляйому тогонеобхідно, щоб доставитидетальна виділенийінформація, продуктивнийщо вихід,зберігається потрібніу детальнітаблиці даніфактів, щодопомогла зберігаютьсядоставити навибраний таблиціпродуктивний фактів транзакціївихід.
; Накопичення знімків
:Цей тип таблиці фактів використовується для показузображення активності процесу, який має чітко визначений початок і кінець, наприклад, обробку замовлення. Порядок рухається за допомогою певних кроків, доки він не буде повністю обробленооброблений. ОскількиЯк тільки ці кроки дощодо виконання замовлення будуть завершені, відповідний рядок в таблиці фактів оновлюєтьсяоновиться. Накопичувальний знімок таблиці часто містить кілька стовпців з датамиданими, кожен з яких є етапом ведення ввиконання процесіпроцесу. Тому важливо мати запис у відповідному параметрі датиданих, якийщо представляємістить невідому датуінформацію, тому щооскільки багато датданих значеньетапу невідоміневідомо на момент створення рядка.
; Тимчасові знімки
:ЗастосовуючиЗастосування теорію та моделюючі технікитеорії {{не перекладено|Тимчасова база даних|тимчасову база даних|en|Temporal database }} Теорія та методимоделюючих моделюваннятехнік фактичноїТаблиць таблиціфактів тимчасових знімків <ref>{{cite web|last=Davide|first=Mauri|title=Temporal Snapshot Fact Table|url=http://www.slideshare.net/davidemauri/temporal-snapshot-fact-tables}}</ref> дозволяє мати еквівалент повсякденних знімків без дійсних щоденних знімків. Вона запроваджує концепцію інтервалів часу в таблицютаблиці фактів, що дозволяє заощадити багато місця, оптимізуючи продуктивність, дозволяючи кінцевому користувачевікористувачу мати логічний еквівалент "цікавого моменту", який його цікавить.
==Кроки у розробцірозробки таблиці фактів==
* Визначити бізнес-процес для аналізу (наприклад, продаж).
* ВизначтеВизначити фактичнівимірювання фактифактів (продажі долара), задаючиставлячи питання типу "Яка кількість XX важлива для бізнес-процесу?", Замінившизамінивши XX на різні варіанти, якіщо мають сенс у контексті бізнесу.
* ВизначтеВизначити параметри для фактів (розмірміра продукту, розмірністьрозміщення виміру, часовий розмірвимір, організаційний аспект), задаючиставлячи питання, які мають сенс у контексті бізнесу, наприклад, "Аналіз за XX", де XX замінюється предметомв залежності від предмета, який длянеобхідно тестуваннявипробувати.
* ПерерахуйтеПерерахувати стовпці, що описують кожен параметр (назва регіону, назва філії, назва бізнес-підрозділу).
* ВизначтеВизначити найнижчий рівень (гранулярністьгранулярності) резюмепідсумку нав таблиці фактів (наприклад, доларипродажів продажудоларів).
 
Альтернативний підхід - це чотириетапний процес оформлення, описаний у Kimball:<ref name="Kimball DWT"/>
1) ВиберітьВибрати бізнес-процес;
2) визначтеВизначити "зерно";
3) Визначити виміри;
3) визначте розміри;
4) визначтеВизначити факти.
 
==Список літератури==