Схема зірки: відмінності між версіями

[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
виправив вступ
Немає опису редагування
Рядок 4:
 
== Модель ==
Схема зірки відокремлює дані бізнес-процесів від фактів, які містять вимірювані, кількісні дані про бізнес, і розмірирозмірності, які є описовими атрибутами, пов'язаними з даними про факти. Приклади фактичних даних включають ціну продажу, кількість продажів, час, відстань, швидкість і вагу. Приклади відповідних атрибутів виміру включають моделі продуктів, кольори продукту, розміри продуктів, географічні розташування та імена продавців.
 
Схема зірки, яка має багато вимірів, іноді називається ''схемою сороконіжки''.<ref name="Kimball-DWHToolkit">Ralph Kimball and Margy Ross, ''The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Second Edition)'', p. 393</ref> РозміриПоказники лише декількох атрибутів, хоча й простіше підтримувати, призводять до запитів з багатьма приєднаннями таблиць і робить схему зірки менш зручною у використанні.
 
=== Таблиці фактів ===
Рядок 17:
Таблицям фактів, як правило, призначаються [[Сурогатний ключ|сурогатні ключі]] для забезпечення однозначної ідентифікації кожного рядка. Цей ключ є простим первинним ключем.
 
=== Таблиці розміріврозмірностей ===
 
Таблиці розміріврозмірностей зазвичай мають відносно невелику кількість записів у порівнянні з таблицями фактів, але кожен запис може мати дуже велику кількість атрибутів для опису даних про факти. Розмірирозмірності можуть визначати найрізноманітніші характеристики, але деякі з найбільш поширених атрибутів, визначених таблицями розміріврозмірностей, включають:
 
* Таблиці розміріврозмірностей часу описують час на найнижчому рівні часової деталізації, для якого події записуються у схему зірки
* Таблиці розміріврозмірностей географії описують дані про місцезнаходження, такі як країна, штат або місто
* Таблиці розміріврозмірностей продукту описують продукти
* Таблиці розміріврозмірностей співробітників описують співробітників, таких як люди з продажу
* Таблиці розміріврозмірностей діапазонів описують діапазони часу, значення долара або інших вимірюваних величин для спрощення звітування
 
Таблицям розміріврозмірностей, як правило, призначаються сурогатні первинні ключі, зазвичай типу цілого ряду з одним стовпчиком, який відображається на комбінації атрибутів розмірності, які формують природний ключ.
 
== Переваги ==
Рядок 50:
<code>Fact_Sales</code> є таблицею фактів і також є три таблиці вимірів <code>Dim_Date</code>, <code>Dim_Store</code> та <code>Dim_Product</code>.
 
Кожна таблиця розміріврозмірностей має первинний ключ у своєму <code>Id</code> стовпчику, що відносяться до одного зі стовпців (переглядаються як рядки у прикладі) <code>Fact_Sales</code> таблиці&nbsp;— триколонного первинного (з'єднуючого) ключа (<code>Date_Id</code>, <code>Store_Id</code>, <code>Product_Id</code>). Стовпчик непервинного ключа <code>Units_Sold</code> таблиці фактів у цьому прикладі являє собою міру або метрику, яка може бути використана в розрахунках і аналізі. Стовпці непервинних ключів таблиць розміріврозмірностей являють собою додаткові атрибути розміріврозмірностей (таких як <code>Year</code> у <code>Dim_Date</code> таблиці).
 
Наприклад, наступний запит відповідає, скільки телевізорів було продано, для кожної марки та країни, у 1997 році: