Úvod do typov dátových skladov

Dátový sklad je spôsob zhromažďovania údajov z rôznych zdrojov a ich spravovania s cieľom poskytnúť zmysluplné obchodné informácie. Na základe týchto údajov sa rozhoduje o strategickom raste podnikania. Uchováva obrovské množstvo údajov od firmy. Dátový sklad je navrhnutý tak, aby namiesto spracovania transakcií umožnil dopytovanie a analýzu údajov. Celý proces zahŕňa transformáciu údajov a ich sprístupnenie používateľom, aby ich mohli včas využiť a priniesť spoločnosti dôležitosť a zvýšiť ich rast. Nasledujú rôzne typy dátového skladu.

Typy dátových skladov

Existujú tri typy dátových skladov:

  • Enterprise Data Warehouse.
  • Ukladanie prevádzkových údajov.
  • Data Mart.

1. Enterprise Data Warehouse

Podniková databáza je databáza, ktorá spája rôzne funkčné oblasti organizácie a spája ich jednotným spôsobom. Je to centralizované miesto, kde sa sprístupňujú všetky obchodné informácie z rôznych zdrojov a aplikácií. Po uložení môžu byť použité na analýzu a môžu ich používať všetci ľudia v organizácii. Údaje možno klasifikovať podľa subjektu a umožňujú prístup podľa potrebného rozdelenia. Enterprise Datawarehouse už bude mať k dispozícii kroky na extrahovanie, transformáciu a prispôsobenie.

Cieľom EDW je poskytnúť úplný prehľad každého konkrétneho objektu v dátovom modeli. Toto sa dosiahne identifikáciou a usporiadaním údajov z rôznych systémov. Toto sa potom načíta do konzistentného a prispôsobeného modelu. Po tom, čo všetky informácie zhromaždí EDW, ktorá je schopná poskytnúť prístup na jedno miesto, kde je možné na vykonávanie analytických funkcií a vytváranie rôznych predpovedí použiť rôzne nástroje. Výskumné tímy môžu identifikovať nové trendy alebo vzorce a zamerať sa na ne, aby pomohli rastu podniku.

Je možné zostaviť Data Marts, ktoré uľahčujú oddelenie údajov. Vzťahy medzi entitami sa môžu vytvárať a presadzovať ako súčasť načítania údajov do EDW. Okrem tohto krájania a nakrájania na kocky podľa rôznych kategórií je možné tiež vykonať. Pomáha tiež znižovať nákladné prestoje, ktoré sa môžu vyskytnúť v dôsledku konfigurácií náchylných na chyby s prispôsobiteľnými prístupmi a prístupmi k strojovému učeniu. Štruktúruje údaje, ktoré pomáhajú pri prevádzke v relatívne malom rozsahu, organizujú a štruktúrujú ich. Dáta sa ukladajú logickým a konzistentným spôsobom.

2. Uloženie prevádzkových údajov

Ako alternatívu k aplikácii operačného systému na podporu rozhodovania sa používa úložisko prevádzkových údajov. Pomáha pri prístupe k údajom priamo z databázy, čo tiež podporuje spracovanie transakcií. Dáta, ktoré sa nachádzajú v úložisku prevádzkových údajov, sa dajú vypratať a redundancia, ktorá je prítomná, sa dá skontrolovať a vyriešiť kontrolou príslušných obchodných pravidiel. Pomáha tiež pri integrácii kontrastných údajov z viacerých zdrojov, aby sa mohli ľahko vykonávať obchodné operácie, analýzy a vykazovanie, a pomôcť podniku, zatiaľ čo proces pokračuje.

Tu sa väčšina operácií, ktoré sa práve vykonávajú, uloží skôr, ako sa presunú do dátového skladu na dlhšie obdobie. Účinne pomáha pri jednoduchých dopytoch a pri malom množstve údajov. Funguje ako krátkodobá alebo dočasná pamäť, v ktorej sú uložené najnovšie informácie. Dátový sklad ukladá údaje pomerne dlhú dobu a tiež ukladá relatívne trvalé informácie.

Pomáha pri ukladaní transakčných údajov z jedného alebo viacerých výrobných systémov a voľne ich integruje. Niekedy je to subjektovo orientovaný a časový variant. Integrácia sa dosiahne využitím štruktúr a obsahu EDW. Integrácia údajov môže zahŕňať čistenie, riešenie nadbytočnosti, kontrolu integrity obchodných pravidiel. Zvyčajne je navrhnutý tak, aby obsahoval atómové údaje nízkej úrovne, v ktorých sú uložené obmedzené údaje.

3. Údaje Mart

Data Mart sa zameriava na ukladanie údajov pre konkrétnu funkčnú oblasť a obsahuje podmnožinu údajov uložených v dátovom sklade. Data Marts pomáhajú pri zlepšovaní reakcií používateľov a tiež znižujú objem údajov na analýzu údajov. Uľahčuje to pokračovanie vo výskume. Implementácia Data Mart ako podmnožiny Datawarehouse sa ľahko implementuje. V porovnaní s kompletným dátovým skladom je nákladovo efektívny. Je otvorenejšia na zmenu a jediný odborník v odbore môže definovať svoju štruktúru a konfiguráciu. Dáta sú rozdelené a podrobnosti môžu byť ľahko kontrolované. Data Mart má tri typy. Ide o tieto typy:

  • závislý
  • Nezávislý
  • Hybrid

Závislé údaje Mart

Získaním údajov z prevádzkových, externých alebo obidvoch zdrojov je možné vytvoriť závislý dátový server. Umožňuje údaje organizácie poskytujúcej údaje z jedného dátového skladu. Všetky údaje sú centralizované a môžu pomôcť pri vývoji väčšieho množstva údajov.

Nezávislé údaje Mart

Tento dátový server nevyžaduje centrálny dátový sklad. Zvyčajne sa vytvára pre menšie skupiny, ktoré sú prítomné v organizácii. Nemá žiadny vzťah k Enterprise Data Warehouse ani k inému údajovému serveru. Všetky údaje sú nezávislé a môžu sa používať samostatne. Analýza sa môže vykonávať aj autonómne. Dôsledné a centralizované ukladanie údajov je veľmi dôležité, aby ich mohli používať viacerí používatelia.

Hybrid Data Mart

Ako už názov napovedá, používa sa hybridný dátový server, keď sú vstupy z rôznych zdrojov súčasťou dátového skladu. Je to užitočné, keď chce užívateľ integráciu ad hoc. Kedykoľvek organizácia potrebuje viac databázových prostredí a rýchlu implementáciu, toto nastavenie sa dá použiť. Vyžaduje to najmenšie úsilie na vyčistenie údajov a dátový server podporuje veľké štruktúry ukladania. Najlepšie využitie dátového centra je, keď sa používajú menšie aplikácie zamerané na údaje.

záver

Dátový sklad je teda veľmi dôležitým komponentom v dátovom priemysle. Pretože databáza pomáha pri ukladaní a spracovávaní údajov, dátový sklad pomáha pri ich analýze. Dátový sklad tak pomáha pri získavaní obchodných trendov a modelov, ktoré môžu byť neskôr prezentované vo forme správ, ktoré poskytujú prehľad o tom, ako postupovať v procese rastu podniku. Dátový sklad teda hrá dôležitú úlohu pri vytváraní kontaktnej základne v dátovom priemysle.

Odporúčané články

Toto bol sprievodca Typy dátového skladu. Tu sme diskutovali o konceptoch s rôznymi typmi DataWarehouse. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je to Data Analyst?
  2. Úvod do čo je SQL Server?
  3. Čo je to MapReduce? | Ako to funguje
  4. Návody na tému Čo je Cognos?

Kategórie: