Tabuľka rozmerov Úvod Druhy Ako to funguje výhody

Obsah:

Anonim

Úvod do tabuľky rozmerov

V schéme hviezd alebo snehových vločiek je tabuľka s rozmermi. Tabuľky rozmerov pomáhajú opísať dimenzie, tj hodnoty rozmerov, atribúty a kľúče. Má zvyčajne malú veľkosť. Veľkosť sa môže pohybovať od niekoľkých do tisíc riadkov. Popisuje objekty prítomné v tabuľke faktov. Dimenzná tabuľka sa týka súboru alebo skupiny informácií týkajúcich sa akejkoľvek merateľnej udalosti. Tvoria jadro pre rozmerové modelovanie. Obsahuje stĺpec, ktorý možno považovať za stĺpec primárneho kľúča, ktorý pomáha jedinečne identifikovať každý riadok alebo záznam dimenzie. Prostredníctvom tohto kľúča sa spája s tabuľkami faktov. Keď je vytvorený, kľúč, ktorý sa nazýva náhradný kľúč, ktorý je vygenerovaný systémom, sa používa na jedinečnú identifikáciu riadkov v dimenzii.

Prečo musíme používať?

  • Jeho pomoc pri ukladaní histórie informácií alebo rozmerových informácií.
  • Je to ľahké pochopiť ako normalizované tabuľky.
  • Do tabuľky možno pridať viac stĺpcov bez toho, aby to ovplyvnilo existujúce aplikácie, ktoré ich používajú.

Typy rozmerových tabuliek

Nasledujú rôzne typy rozmerových tabuliek:

1. SCD (pomaly sa meniace rozmery)

Atribúty dimenzie, ktoré majú tendenciu sa meniť pomaly s časom a nie sa meniť v pravidelnom časovom intervale, sa nazývajú pomaly sa meniace dimenzie. Napríklad zmena adresy a telefónneho čísla, ale nie pravidelne. Pozrime sa na príklad muža, ktorý cestuje do rôznych krajín, takže musí zmeniť svoju adresu podľa danej krajiny. To je možné dosiahnuť tromi spôsobmi:

Type1: Prepíše predchádzajúcu hodnotu. Táto metóda sa dá ľahko použiť a pomáha šetriť miesto, čím sa znižujú náklady. V tomto scenári sa však stratí história.

Tabuľka pred zmenou

IDNÁZOVKRAJINAŠTÁTNE
1001RachelIndiaindický

Tabuľka po zmene

IDNÁZOVKRAJINAŠTÁTNE
1001RachelČínaindický

Type2: Pridajte nový riadok s novou hodnotou. V tejto metóde sa história uloží a môže sa použiť kedykoľvek je to potrebné. Ale to vyžaduje veľký priestor, a preto zvyšuje náklady.

Tabuľka pred zmenou

IDNÁZOVKRAJINAŠTÁTNE
1001RachelIndiaindický

Tabuľka po zmene

IDNÁZOVKRAJINAŠTÁTNE
1001RachelIndiaindický
1001RachelČínaindický

Type3: Pridajte nový stĺpec. Je to najlepší prístup, pretože história sa dá ľahko udržiavať.

Tabuľka pred zmenou

IDNÁZOVKRAJINAŠTÁTNE
1001RachelIndiaindický

Tabuľka po zmene

IDNÁZOVKRAJINASTARÁ KRAJINAŠTÁTNE
1001RachelČínaIndiaindický

2. Konformovaná dimenzia

Táto dimenzia je zdieľaná medzi viacerými oblasťami predmetov alebo dátovými kartami. To isté sa dá použiť v rôznych projektoch bez akýchkoľvek úprav v tom istom. Používa sa na udržanie konzistencie. Konformované rozmery sú tie, ktoré sú presne rovnaké alebo správna podmnožina akejkoľvek inej dimenzie.

3. Nevyžiadaná dimenzia

Nezmyselná dimenzia je skupina atribútov nízkej kardinality. Obsahuje rôzne alebo rôzne atribúty, ktoré nesúvisia s akýmkoľvek iným atribútom. Tieto môžu byť použité na implementáciu RCD (rýchlo sa meniaca dimenzia), ako sú vlajky, závažia atď.

4. Degenerovaná dimenzia

Atribúty, ktoré sú uložené v samotnej tabuľke faktov a nie ako samostatná tabuľka dimenzií, sa tieto atribúty nazývajú degenerovaná dimenzia. Napríklad číslo lístka, číslo faktúry, číslo transakcie atď.

5. Rozmery hry

Viacnásobné vzťahy s tabuľkou faktov sa nazývajú dimenzia hrania rolí. Inými slovami je to vtedy, keď je ten istý rozmerový kľúč so všetkými súvisiacimi atribútmi spojený s mnohými cudzími kľúčmi v tabuľke faktov. V rámci tej istej existujúcej databázy môže plniť viacero účelov.

Ako to funguje v dátovom sklade?

  • Dimenzia označuje súbor alebo skupinu informácií týkajúcich sa akejkoľvek merateľnej udalosti. Tvoria jadro pre rozmerové modelovanie. Po vytvorení dimenzie sa vygeneruje štruktúra projektu. Vytvorené môžu byť použité v rôznych projektoch a odráža myšlienku opätovného použitia. Ak sa v niektorej z nich uskutoční zmena, jej účinok sa prejaví iba v tejto konkrétnej tabuľke. Keď sa má zostaviť výkaz, užívateľ môže vziať údaje, pretože tabuľky rozmerov obsahujú všetky potrebné informácie.
  • Pri vykonávaní modelovania dimenzií sa atómové údaje načítajú do rozmerových štruktúr. Potom sa generujú rozmerové modely alebo sa budujú okolo obchodných procesov. Pri jej vytváraní je potrebné pamätať na filtrovanie hodnôt domén a ukladanie menoviek prehľadov do týchto tabuliek. Musí sa zabezpečiť, aby sa pri vytváraní tabuľky rozmerov používal náhradný kľúč (systémom generovaný kľúč, ktorý sa používa pri vytváraní tabuľky rozmerov, ktorý pomáha jedinečne identifikovať každý záznam prítomný v tabuľke rozmerov.). Musí sa denormalizovať, pretože ich úlohou je umožniť užívateľovi čítať a analyzovať údaje ľahšie a efektívnejšie ako spravovať transakcie. Hlavným cieľom dimenzie je zabezpečiť filtrovanie, vykonávať zoskupovanie a efektívne označovanie.

výhody

Nižšie sú uvedené rôzne výhody tabuľky rozmerov:

  • Má jednoduchú štruktúru.
  • Je ľahké analyzovať a porozumieť.
  • Denormalizované údaje.
  • Pomáha udržiavať historické informácie pre akúkoľvek dimenziu.
  • Ľahko z nej získať dáta.
  • Rýchle vytváranie a implementácia.
  • Poskytuje kontext okolitých obchodných procesov.

Záver - Dimenzná tabuľka

Toto je neoddeliteľnou súčasťou modelovania údajov. Používa sa v schéme hviezd alebo snehových vločiek. Obsahuje rozmery, kľúče a hodnoty atribútov tabuľky faktov. Existujú rôzne typy, ktoré sa používajú v rôznych scenároch.

Odporúčané články

Toto je príručka pre tabuľku rozmerov. Tu sme diskutovali o typoch, ako funguje tabuľka dimenzií v dátovom sklade s výhodami. Viac informácií nájdete aj v ďalších súvisiacich článkoch.

  1. Tabuľka faktov vs tabuľka rozmerov
  2. Čo je tabuľka faktov?
  3. Čo je Tableau?
  4. Miešanie údajov v Tableau