Úvod do dát Mart
Svet sa stáva digitálnejším a každá organizácia generuje niekoľko petabajtov údajov. Data Mart je jedna takáto klasifikácia údajov z dátového skladu, kde je koncentrácia zameraná na jeden subjekt.
Dá sa povedať, že ide o údaje týkajúce sa jedného konkrétneho oddelenia alebo kategórie, napríklad predaja, financií alebo marketingu atď. V podstate ide o podskupinu skladovania údajov. Keďže sa sústredíme na konkrétne predmety alebo odbor, môžeme povedať, že ich zdroj je obmedzený alebo je závislý od veľmi malého počtu zdrojov.
Data Mart vs Data Warehouse
Dátový sklad je sklad so zbierkou údajov z viacerých tokov subjektu. Údržbársku a kontrolnú časť, ako je zber nespracovaných údajov a ich spracovanie, spravujú hlavne IT skupiny podnikových informačných technológií, ktoré poskytujú rôzne služby materským organizáciám.
Dátový sklad sa označuje aj ako centrálny alebo podnikový dátový sklad. Zdroj dátového skladu bude teda na rozdiel od dátového servera, ktorý je v niektorých prípadoch podskupinou dátového skladu, viacnásobný.
Typy údajov Mart
Typicky existujú tri typy dátových máp. Oni sú:
1. Závislý sklad údajov
Závislý dátový server je čisto z dátového skladu a všetok zoskupený závislý bude tvoriť podnikový dátový sklad. Je to čisto podskupina dátového skladu, pretože je vytvorený z centrálneho DW.
Pretože čisté a súhrnné údaje sú už v centrálnom dátovom sklade ETT, zjednodušuje sa proces extrakcie transformácie a dopravy. Potrebujeme iba identifikovať konkrétnu podmnožinu a vykonať ETT.
Tieto dátové mapy sú obvykle skonštruované tak, aby sa dosiahla lepšia dostupnosť a veľa zlepšeného výkonu s lepšou kontrolou a účinnosťou.
2. Nezávislé údaje Mart
To sa nevytvára z centrálneho dátového skladu a jeho zdroj sa môže líšiť. Pretože dáta sú z iného ako centrálneho procesu DW ETT, je trochu iný.
Väčšinu nezávislého údajového servera používa menšia skupina organizácií a jeho zdroje sú tiež obmedzené. Nezávislý dátový server sa zvyčajne vytvára vtedy, keď potrebujeme nájsť riešenie v relatívne kratšej lehote.
3. Hybrid Data Mart
Hybridný dátový server vám umožní zoskupiť údaje zo všetkých iných zdrojov, ako je centrálny dátový sklad DW. Ak sa budeme zaoberať integráciou ad hoc, bude to veľmi prospešné pre špičkovú prácu na všetkých produktoch, ktoré sa do organizácií pridali navonok.
Funkcie Data Mart
Nižšie sú uvedené niektoré z vlastností dátového centra:
- Pretože zdroj údajov je sústredený na subjekt, jeho doba odozvy sa pomocou jeho použitia zvyšuje.
- Pre často požadované údaje bude výhodné použiť dátové mapy, pretože je podsúborom centrálneho DW, a preto bude veľkosť údajov menšia.
- Pretože objem dát je obmedzený, čas spracovania sa v porovnaní s centrálnymi Dws pomerne skráti.
- V zásade sú agilné a v porovnaní s dátovým skladom dokážu pomerne rýchlo a efektívne zvládnuť zmeny modelu.
- Datamart vyžaduje, aby odborník na jeden predmet zvládal na rozdiel od údajov zo skladu odbornosť, ktorú požadujeme vo viacerých skladoch predmetov. Z tohto dôvodu hovoríme, že dátový server je agilnejší.
- Môžeme oddeliť kategórie prístupu na nízku úroveň s rozdelenými údajmi as dátovým serverom, je to veľmi jednoduché.
- Závislosť od infraštruktúry je pomerne obmedzená a údaje sa môžu segmentovať na rôznych hardvérových platformách.
Kroky na implementáciu údajov
Nižšie sú uvedené kroky, ktoré sú potrebné na jeho implementáciu.
1. Navrhovanie
Bude to prvý krok v implementácii, kde sa zistia všetky požadované úlohy a zdroje na zhromažďovanie technických a obchodných informácií. Neskôr sa implementuje logický plán a po preskúmaní sa prevedie na fyzický plán. Tiež sa tu rozhoduje o logickej a fyzickej štruktúre údajov, ako o tom, ako rozdeliť údaje a pole, ako je dátum alebo iný súbor.
2. Konštrukcia
Ide o druhú fázu implementácie, v ktorej sa generovali fyzické databázy pomocou technológie RDBMS, ktorá bola určená ako súčasť procesu návrhu a logických štruktúr. Vytvoria sa všetky objekty, ako napríklad schéma, indexy, tabuľky, zobrazenia atď.
3. Obyvateľstvo
Toto je tretia fáza a tu sa v ňom údaje ukladajú pri získavaní údajov. Všetky požadované transformácie sa implementujú pred naplnením údajov na nej.
4. Prístup
Toto je ďalší krok implementácie, v rámci ktorého použijeme údaje na vytvorenie prehľadov. Koncový používateľ používa tento krok na pochopenie údajov pomocou dopytov.
5. Riadenie
Toto je posledná fáza implementácie dátového martu a tu sa riešia rôzne úlohy, ako je napríklad riadenie prístupu, optimalizácia systému a ladenie, správa a pridávanie čerstvých údajov do dátového martu a hobľovanie scenárov obnovy, aby sa vyriešili všetky prípady zlyhania.
Výhody dát Mart
Nižšie sú uvedené niektoré z výhod jeho použitia.
- Je to jedna z najlepších nákladovo efektívnych alternatív k dátovému skladu, kde musíte pracovať iba na malom segmente údajov.
- Oddelenie údajov zo zdrojov zlepší efektivitu údajov, pretože určitá skupina ľudí môže pracovať s údajmi z konkrétneho zdroja namiesto použitia dátového skladu.
- Rýchlejší prístup k údajom je možný pomocou dátového servera, ak vieme, na ktorú podmnožinu potrebujeme prístup.
- Datamart sa používa oveľa jednoduchšie, takže koncoví používatelia môžu na ne ľahko vyhľadávať.
- Prichádzanie k časovému údaju o implementácii času vyžaduje v porovnaní s dátovým skladom menej času, pretože dáta sú rozdelené do skupín.
- Historické údaje od konkrétneho subjektu sa môžu použiť na ľahkú analýzu trendov.
záver
Pretože sa sústreďuje na jednu funkčnú oblasť, existuje množstvo výhod tak pre implementátora procesu, ako aj pre konečného používateľa. Preto je potrebná efektívna implementácia martov spolu s dátovým skladom v organizácii.
Odporúčané články
Toto je príručka Čo je Data Mart. Tu diskutujeme úvod, funkcie a 3 najčastejšie typy spolu s ich vlastnosťami a krokmi. Ďalšie informácie nájdete aj v nasledujúcich článkoch -
- Oracle Data Warehousing
- R Typy údajov
- Dátové typy Python
- Cassandra Data Modeling
- Kompletný sprievodca dátovým modelom v Cassandre