Rozdiel medzi schémou Star Schem a Snowflake Schema
V tomto článku budeme podrobne diskutovať o rozdieloch medzi schémami hviezd a snehovými vločkami. Schéma je spôsob logického opisovania celých databáz alebo skladov údajov pomocou relačných databáz. Opis môže obsahovať názov a podrobnosti záznamov akéhokoľvek typu so všetkými agregátmi a údajovými položkami. Dátové sklady používajú schému Star, Snowflake, Fact Constellation a Galaxy.
Schéma hviezd
Je to najjednoduchšia schéma údajového skladu. Ako už názov napovedá, jej štruktúra je ako hviezda. V tejto schéme je tabuľka faktov prítomná v strede a počet tabuliek dimenzií je s ňou spojený prostredníctvom cudzieho kľúča a tabuľka dimenzií obsahuje množinu atribútov. V tejto schéme je každá dimenzia reprezentovaná iba jednou tabuľkou dimenzií, ale tabuľky dimenzií nie sú navzájom spojené. Medzi jeho výhody patrí krájanie nadol, ľahké porozumenie dátam, optimálne využitie disku a zvýšenie výkonu. Pozrime sa na príklad na lepšie porozumenie.
Príklad:
Zoberme si spoločnosť vyrábajúcu chladničky a my musíme vytvoriť schému predaja tejto spoločnosti vyrábajúcej chladničky. Predaj bude mať tieto rozmery:
- položka
- umiestnenia
- vetva
- čas
Schéma má v centre predaja tabuľku faktov, ktorá by obsahovala kľúče na priradenie každej dimenzii, s dvoma mierami, tj predanými jednotkami a predanými dolármi.
Schéma snehových vločiek
Schéma snehových vločiek je rozšírenie schémy hviezd. Dodáva mu ďalšie rozmery. Ako už názov napovedá, vyzerá to ako snehová vločka. V tejto schéme sú tabuľky rozmerov normalizované, tj údaje sú rozdelené do ďalších tabuliek. Rozdelenie stola znižuje nadbytočnosť a stratu pamäti. Má hierarchickú podobu rozmerových tabuliek. Tabuľky dimenzií a poddimenzie sú spojené s primárnymi a cudzími kľúčmi v tabuľke faktov. Je jednoduchšie implementovať a spotrebuje menej miesta na disku. Keďže má viac tabuliek, výkon dotazu sa zníži. Vyžaduje sa väčšia údržba, pretože existuje viac vyhľadávacích tabuliek. Pozrime sa na príklad na lepšie porozumenie.
Príklad:
Ak vezmeme do úvahy rovnaký príklad ako vyššie v prípade spoločnosti vyrábajúcej chladničky, v schéme snehových vločiek je tabuľka faktov rovnaká ako v schéme hviezd, ale hlavný rozdiel spočíva v definícii alebo usporiadaní rozmerových tabuliek.
V tejto schéme bola jednorozmerná tabuľka položky normalizovaná a bola rozdelená a bola vytvorená nová tabuľka dodávateľa obsahujúca informácie o type dodávateľa. Podobne je normalizovaná tabuľka dimenzií a údaje sú rozdelené do novej tabuľky miest, ktorá obsahuje podrobnosti o konkrétnom meste.
Porovnanie medzi dvoma schémami medzi schémou hviezd a schémou snehových vločiek (infografika)
Nižšie je uvedených najlepších 9 rozdielov medzi schémou Star Schema a Snowflake Schema.
Hlavné rozdiely medzi schémou hviezd a schémou snehových vločiek
Pozrime sa na niektoré zásadné rozdiely medzi schémou Star Scheme a Snowflake Schema.
Schéma hviezdy:
- Hierarchie dimenzie v schéme hviezd sa ukladajú do tabuľky rozmerov.
- Obsahuje centrálnu tabuľku faktov obklopenú tabuľkou rozmerov.
- V tomto prípade jediné spojenie spojilo tabuľku faktov s tabuľkou dimenzií.
- Má jednoduchý dizajn.
- Štruktúra údajov je denormalizovaná.
- Dotaz sa vykonáva rýchlejšie.
- V tejto kocke je spracovanie rýchlejšie.
- Má viac redundantných údajov.
- Používa jednoduché dotazy.
- Schému hviezd je ľahké pochopiť.
- V schéme hviezd sa spotrebuje viac miesta.
Schéma snehových vločiek:
- Hierarchie v schéme snehových vločiek sú uložené v samostatných tabuľkách.
- Obsahuje tiež tabuľku faktov obklopenú tabuľkou rozmerov a tieto tabuľky rozmerov sú ďalej obklopené tabuľkou rozmerov.
- V tejto schéme je potrebných veľa spojení na načítanie údajov.
- Má komplexný dizajn.
- Štruktúra údajov je normalizovaná v schéme snehových vločiek.
- Dotaz sa vykonáva pomerne pomalšie ako schéma hviezd.
- V schéme snehových vločiek je spracovanie kocky pomalšie.
- Obsahuje menej nadbytočné údaje.
- Používa zložité dotazy.
- Schéme snehových vločiek je pomerne ťažké pochopiť túto schému hviezd.
- V schéme snehových vločiek sa spotrebuje menej miesta.
Porovnávacia tabuľka schémy Star Schema vs Snowflake Schema
Poďme diskutovať o porovnaní medzi schémou Star Scheme a schémou Snowflake.
charakteristický |
Schéma hviezd |
Schéma snehových vločiek |
Údržba / Zmena | Má viac redundantných údajov, a preto je ťažšie ich zmeniť alebo udržiavať | Túto schému je ľahšie meniť a udržiavať z dôvodu menšej redundancie |
zrozumiteľnosť | Zložitosť dotazu je menšia, a preto je ľahké ho pochopiť | Použité otázky sú zložitejšie, a preto ťažko pochopiteľné |
Čas vykonania dotazu | Má menej cudzích kľúčov, a preto je vykonanie dotazu rýchlejšie a vyžaduje kratší čas | Vzhľadom na viac cudzích kľúčov je doba vykonávania dotazu dlhšia alebo sa dotaz vykonáva pomaly |
Typ dátového skladu | Lepšie pre dátové mapy s jedným vzťahom, tj jeden ku jednému alebo jednému k mnohým | Lepšie pre komplexné vzťahy, tj mnoho k mnohým vzťahom |
Počet pripojení | Má viac spojení | Má menší počet pripojení |
Tabuľka rozmerov | Pre každú dimenziu má iba jednu tabuľku dimenzií | Má jednu alebo viac rozmerových tabuliek pre jednu dimenziu |
Použiteľnosť | Ak je veľkosť tabuľky rozmerov menšia, tj menší počet riadkov, uprednostňuje sa schéma hviezd | Dobré použitie, keď je veľkosť tabuľky rozmerov väčšia |
Normalizácia a denormalizácia | Tabuľka faktov aj tabuľky rozmerov sú denormalizované. | Tabuľka faktov je denormalizovaná, zatiaľ čo tabuľka dimenzií je normalizovaná |
Dátový model | Vychádza z prístupu zhora nadol | Vychádza z prístupu zdola nahor |
záver
V tomto článku sme podrobne diskutovali o schéme Star vs Schéma snehových vločiek. Tieto schémy sa používajú na reprezentáciu dátového skladu. V niektorých aspektoch sú podobné a iné v iných. Snowflake je rozšírenie schémy hviezd. Ak je viac údajov, potom sa uprednostňuje snehová vločka, pretože znižuje nadbytočnosť, ale hviezda je pomerne obľúbenejšia ako schéma snehových vločiek.
Odporúčané články
Toto je sprievodca Star Schema verzus Snowflake Schema. Ďalej diskutujeme o kľúčových rozdieloch medzi schémami hviezd a snehových vločiek s informačnými a porovnávacími tabuľkami. Viac informácií nájdete aj v ďalších navrhovaných článkoch -
- Kódovanie vs dekódovanie - najväčšie rozdiely
- Rozdiel medzi malými dátami Vs Big Data
- Funkčné testovanie vs nefunkčné testovanie
- Testovanie dymu verzus testovanie hygieny
- Čo je testovanie hygieny a ako to funguje?