Rozdiel medzi schémou Star Schem a Snowflake Schema

V tomto článku budeme podrobne diskutovať o rozdieloch medzi schémami hviezd a snehovými vločkami. Schéma je spôsob logického opisovania celých databáz alebo skladov údajov pomocou relačných databáz. Opis môže obsahovať názov a podrobnosti záznamov akéhokoľvek typu so všetkými agregátmi a údajovými položkami. Dátové sklady používajú schému Star, Snowflake, Fact Constellation a Galaxy.

Schéma hviezd

Je to najjednoduchšia schéma údajového skladu. Ako už názov napovedá, jej štruktúra je ako hviezda. V tejto schéme je tabuľka faktov prítomná v strede a počet tabuliek dimenzií je s ňou spojený prostredníctvom cudzieho kľúča a tabuľka dimenzií obsahuje množinu atribútov. V tejto schéme je každá dimenzia reprezentovaná iba jednou tabuľkou dimenzií, ale tabuľky dimenzií nie sú navzájom spojené. Medzi jeho výhody patrí krájanie nadol, ľahké porozumenie dátam, optimálne využitie disku a zvýšenie výkonu. Pozrime sa na príklad na lepšie porozumenie.

Príklad:

Zoberme si spoločnosť vyrábajúcu chladničky a my musíme vytvoriť schému predaja tejto spoločnosti vyrábajúcej chladničky. Predaj bude mať tieto rozmery:

  • položka
  • umiestnenia
  • vetva
  • čas

Schéma má v centre predaja tabuľku faktov, ktorá by obsahovala kľúče na priradenie každej dimenzii, s dvoma mierami, tj predanými jednotkami a predanými dolármi.

Schéma snehových vločiek

Schéma snehových vločiek je rozšírenie schémy hviezd. Dodáva mu ďalšie rozmery. Ako už názov napovedá, vyzerá to ako snehová vločka. V tejto schéme sú tabuľky rozmerov normalizované, tj údaje sú rozdelené do ďalších tabuliek. Rozdelenie stola znižuje nadbytočnosť a stratu pamäti. Má hierarchickú podobu rozmerových tabuliek. Tabuľky dimenzií a poddimenzie sú spojené s primárnymi a cudzími kľúčmi v tabuľke faktov. Je jednoduchšie implementovať a spotrebuje menej miesta na disku. Keďže má viac tabuliek, výkon dotazu sa zníži. Vyžaduje sa väčšia údržba, pretože existuje viac vyhľadávacích tabuliek. Pozrime sa na príklad na lepšie porozumenie.

Príklad:

Ak vezmeme do úvahy rovnaký príklad ako vyššie v prípade spoločnosti vyrábajúcej chladničky, v schéme snehových vločiek je tabuľka faktov rovnaká ako v schéme hviezd, ale hlavný rozdiel spočíva v definícii alebo usporiadaní rozmerových tabuliek.

V tejto schéme bola jednorozmerná tabuľka položky normalizovaná a bola rozdelená a bola vytvorená nová tabuľka dodávateľa obsahujúca informácie o type dodávateľa. Podobne je normalizovaná tabuľka dimenzií a údaje sú rozdelené do novej tabuľky miest, ktorá obsahuje podrobnosti o konkrétnom meste.

Porovnanie medzi dvoma schémami medzi schémou hviezd a schémou snehových vločiek (infografika)

Nižšie je uvedených najlepších 9 rozdielov medzi schémou Star Schema a Snowflake Schema.

Hlavné rozdiely medzi schémou hviezd a schémou snehových vločiek

Pozrime sa na niektoré zásadné rozdiely medzi schémou Star Scheme a Snowflake Schema.

Schéma hviezdy:

  • Hierarchie dimenzie v schéme hviezd sa ukladajú do tabuľky rozmerov.
  • Obsahuje centrálnu tabuľku faktov obklopenú tabuľkou rozmerov.
  • V tomto prípade jediné spojenie spojilo tabuľku faktov s tabuľkou dimenzií.
  • Má jednoduchý dizajn.
  • Štruktúra údajov je denormalizovaná.
  • Dotaz sa vykonáva rýchlejšie.
  • V tejto kocke je spracovanie rýchlejšie.
  • Má viac redundantných údajov.
  • Používa jednoduché dotazy.
  • Schému hviezd je ľahké pochopiť.
  • V schéme hviezd sa spotrebuje viac miesta.

Schéma snehových vločiek:

  • Hierarchie v schéme snehových vločiek sú uložené v samostatných tabuľkách.
  • Obsahuje tiež tabuľku faktov obklopenú tabuľkou rozmerov a tieto tabuľky rozmerov sú ďalej obklopené tabuľkou rozmerov.
  • V tejto schéme je potrebných veľa spojení na načítanie údajov.
  • Má komplexný dizajn.
  • Štruktúra údajov je normalizovaná v schéme snehových vločiek.
  • Dotaz sa vykonáva pomerne pomalšie ako schéma hviezd.
  • V schéme snehových vločiek je spracovanie kocky pomalšie.
  • Obsahuje menej nadbytočné údaje.
  • Používa zložité dotazy.
  • Schéme snehových vločiek je pomerne ťažké pochopiť túto schému hviezd.
  • V schéme snehových vločiek sa spotrebuje menej miesta.

Porovnávacia tabuľka schémy Star Schema vs Snowflake Schema

Poďme diskutovať o porovnaní medzi schémou Star Scheme a schémou Snowflake.

charakteristický

Schéma hviezd

Schéma snehových vločiek

Údržba / ZmenaMá viac redundantných údajov, a preto je ťažšie ich zmeniť alebo udržiavaťTúto schému je ľahšie meniť a udržiavať z dôvodu menšej redundancie
zrozumiteľnosťZložitosť dotazu je menšia, a preto je ľahké ho pochopiťPoužité otázky sú zložitejšie, a preto ťažko pochopiteľné
Čas vykonania dotazuMá menej cudzích kľúčov, a preto je vykonanie dotazu rýchlejšie a vyžaduje kratší časVzhľadom na viac cudzích kľúčov je doba vykonávania dotazu dlhšia alebo sa dotaz vykonáva pomaly
Typ dátového skladuLepšie pre dátové mapy s jedným vzťahom, tj jeden ku jednému alebo jednému k mnohýmLepšie pre komplexné vzťahy, tj mnoho k mnohým vzťahom
Počet pripojeníMá viac spojeníMá menší počet pripojení
Tabuľka rozmerovPre každú dimenziu má iba jednu tabuľku dimenziíMá jednu alebo viac rozmerových tabuliek pre jednu dimenziu
PoužiteľnosťAk je veľkosť tabuľky rozmerov menšia, tj menší počet riadkov, uprednostňuje sa schéma hviezdDobré použitie, keď je veľkosť tabuľky rozmerov väčšia
Normalizácia a denormalizáciaTabuľka faktov aj tabuľky rozmerov sú denormalizované.Tabuľka faktov je denormalizovaná, zatiaľ čo tabuľka dimenzií je normalizovaná
Dátový modelVychádza z prístupu zhora nadolVychádza z prístupu zdola nahor

záver

V tomto článku sme podrobne diskutovali o schéme Star vs Schéma snehových vločiek. Tieto schémy sa používajú na reprezentáciu dátového skladu. V niektorých aspektoch sú podobné a iné v iných. Snowflake je rozšírenie schémy hviezd. Ak je viac údajov, potom sa uprednostňuje snehová vločka, pretože znižuje nadbytočnosť, ale hviezda je pomerne obľúbenejšia ako schéma snehových vločiek.

Odporúčané články

Toto je sprievodca Star Schema verzus Snowflake Schema. Ďalej diskutujeme o kľúčových rozdieloch medzi schémami hviezd a snehových vločiek s informačnými a porovnávacími tabuľkami. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Kódovanie vs dekódovanie - najväčšie rozdiely
  2. Rozdiel medzi malými dátami Vs Big Data
  3. Funkčné testovanie vs nefunkčné testovanie
  4. Testovanie dymu verzus testovanie hygieny
  5. Čo je testovanie hygieny a ako to funguje?

Kategórie: