Úvod do Oracle Data Warehousing
Skladovanie údajov vo všeobecnosti možno definovať ako databázu na zhromažďovanie obchodných alebo organizačných údajov, na ktorých možno dosiahnuť požadované činnosti v obchodných prípadoch. Pravidelné transakčné operácie sú oddelené od celkového pracovného zaťaženia, zatiaľ čo ukladanie historických záznamov na analýzu a vylepšovanie sa vykonáva pred skladovaním. V tomto článku sa budeme venovať Oracle Data Warehousing.
Presne povedané, dátové sklady zahŕňajú:
- Hromadenie historických záznamov z rôznych zdrojov údajov.
- Kontrola a analýza minulých obchodných záznamov.
- Získavajte informácie a požadované informácie, ktoré zvyšujú obchodné potreby a motívy.
Operácie sa teda väčšinou zameriavajú skôr na čítanie, než na priamu manipuláciu so súbormi údajov. Skladovanie údajov Oracle je plne optimalizovaná, komplexná a spoľahlivá koncepcia databázy Oracle z cloudu. Je primárne postavený na skúsenosti s účinnými a flexibilnými databázovými operáciami, vďaka ktorým poskytuje najvyšší výkon na trhu.
Charakteristika skladovania údajov
William H. Inmon, americký počítačový vedec, poukazuje na charakteristiky skladovania údajov ako:
-
Predmet orientovaný
Dátový sklad je primárne vykreslený na analýzu údajov a odvodenie poznatkov. Sklady vyrábame na zákazku na konkrétnych oddeleniach firmy.
ktoré môžu následne odvodiť výkonnostných tabuliek, cieľových zákazníkov atď.
-
integrovaný
Dáta, s ktorými sa manipuluje, sa často získavajú z rôznych zdrojov. Za týchto okolností by údaje mali prevládať dôsledným predchádzaním konfliktom. Takáto vlastnosť je integrita.
-
Neprchavý
Ak sú dáta odovzdané do skladu, nie je možné s nimi manipulovať alebo ich meniť. Odkedy sa vykonáva analýza údajov, ktoré sa vyskytli.
-
Time-Variant
Na odvodenie trendov a regresie historických údajov potrebuje analytik obrovské množstvo údajov.
Architektúra Oracle Data Warehousing
Všeobecne možno architektúru skladovania údajov Oracle všeobecne klasifikovať ako:
1. Jednovrstvová architektúra
Hlavným cieľom je do značnej miery znížiť ukladanie údajov, čím sa odstráni nadbytočnosť. V praxi sa však používa oveľa menej.
2. Dvojvrstvová architektúra
Diskrétna vrstva fyzicky dostupných zdrojov údajov a dátových skladov. V porovnaní s tým architektúra nie je rozšíriteľná a tiež čelí obmedzeniam pripojenia.
3. Trojvrstvová architektúra
Slávna architektúra sa skladá z dolnej, strednej a hornej vrstvy.
- Spodná vrstva: Databáza spočíva v tejto vrstve, ktorá je zväčša relačnými databázovými systémami. Zdroje údajov sú zhromažďované a manipulované pomocou rôznych aplikácií typu back-end a dodávané do databázy.
- Stredná vrstva: Abstrahovaný vrstvený pohľad na databázu, ktorá funguje ako medziprodukt medzi používateľom a databázou. Oracle podporuje výkonný OLAP, ktorý je implementovaný v strednej vrstve a poskytuje bezpečné, škálovateľné analytické opatrenia v systéme.
- Horná vrstva: Predná vrstva vyvoláva údaje z databázy a predkladá ich klientovi. Môže to byť ktorýkoľvek z dotazovacích nástrojov založených na Oracle, ako je SQLPlus, vývojár SQL.
Teraz sa pohneme vpred a preskúmame podrobnosti celkovej architektúry. Pozrite si nasledujúci obrázok:
- Hlavný centrálny systém, tj dátový sklad Oracle, pozostáva z nespracovaných údajov, metaúdajov a súhrnných údajov.
- Nespracované údaje sú skutočným užitočným zaťažením bežných uložených OLTP, spolu s ktorými metaúdaje definujú údaje prítomné vo vnútri.
- Na druhej strane súhrnné údaje obsahujú všetky nadbytočné drahé a dlhodobé operácie, ktoré sa tiež nazývajú materializované zobrazenie.
- Poskytovanie správneho zdroja údajov o kvalite je dôležitejšie, čo zasa v dlhodobom horizonte ovplyvňuje kvalitu a údržbu skladovania údajov.
Zdroje dát
- Vo väčších podnikoch sa údaje často získavajú z rôznych kanálov.
- Môže to byť kdekoľvek, od starých údajov, externých zdrojov, vertikálnych aplikácií.
Pracovná plocha
- Prevádzkové údaje by mali byť spracované a vyčistené pred tlačením do dátového skladu.
- O tento proces sa postará pracovná oblasť, ktorá sa opäť môže spustiť programovo.
- Pracovná oblasť je zodpovedná za konsolidáciu a spracovanie neštruktúrovaných údajov z rôznych zdrojov údajov.
- Význam oblasti zastávky je možné realizovať pri manipulácii s podnikovými skladmi, kde by údaje mali pochádzať z kolektívne v nestrukturovanom formáte, spracované a konsolidované pred ich vložením do skladu.
Data Marts
- Okrem zaobchádzania so zdrojmi údajov by podniková spoločnosť často vyžadovala prispôsobenie rozsahu architektúry rôznym skupinám.
- Údajové mapy slúžia na tento účel, keď je systém v závislosti od rôznych oddelení, ako je marketing, účelovo oddelený na účely určenia. Dátové mapy definujú rozsah prístupu používateľov a skupín používateľov a riadia preventívne spôsoby v systéme Windows XP.
- Tím pre tvorbu prehľadov by napríklad mal prístup k obchodným údajom a procesnému panelu, zatiaľ čo predaj používa údaje analytického tímu na riadenie obchodných rozhodnutí. Takáto konsolidácia a definícia rozsahu sú deklarované v dátových mapách.
- Okrem toho sa dátové mapy môžu zvyčajne umiestniť spolu so systémom Oracle Data Storage System alebo niekedy môžu byť vybudované ako samostatný systém, ktorý podporuje škálovateľnosť.
výhody
- V porovnaní s tým sa sklad Oracle považuje za jednoduchý a ľahko konfigurovateľný, ak sú ciele a zdroje jasné.
- Zameriava sa predovšetkým na improvizáciu rozhodovania v podnikaní.
- Zvýšená produktivita a efektívne prevádzkové náklady.
- Podporuje transformáciu veľkých nespracovaných údajov na cenné poznatky.
- Integrita údajov môže byť zaručená okamžitou kvalitou.
nevýhody
So všetkými pochvalmi stranou má sklad údajov Oracle určité nevýhody, ako je vysvetlené nižšie:
-
Bezpečnostné obavy
Bezpečnosť údajov sa dá presne zaúčtovať iba za záruku, ktorá je rovnaká ako zdroj dodávateľa. Aj v prípade, že ide o internú implementáciu, môže byť ťažké zabezpečiť rozsah dôveryhodnej dostupnosti medzi rôznymi prúdmi vo firme.
-
Flexibilita dát
Sklady majú často tendenciu uchovávať statické údaje a podliehajú vážnym štruktúram dopytov.
-
Pomer nákladov a výnosov
Údržba a výdavky na IT hodiny sú obrovským faktorom pri implementácii skladovania Oracle Data.
Riadenie kvality v Oracle Data Warehousing
- Podporuje kvalitné riešenia od konca do konca.
- Sleduje metadáta a zhrnutie úložiska.
- V závislosti od potrieb môže mapovanie spracovať pre opravy údajov.
Úlohy dátového skladu vo firme možno špecificky rozdeliť do rôznych pracovných titulov od Data mineru, konzultanta / vývojára dátového skladu po architekta. IT priemysel je neustále svedkom rýchleho rastu špecializácií na skladovanie dát v technológiách podnikovej inteligencie.
Odporúčané články
Toto je sprievodca Oracle Data Warehousing. Tu diskutujeme o architektúre, charakteristikách, výhodách a nevýhodách skladovania údajov Oracle. Môžete si tiež prečítať naše ďalšie navrhované články -
- Komponenty nástroja Oracle Warehouse Builder
- Čo je Oracle Database a jeho architektúra
- Úvod do funkcií Oracle String
- Jednoduché kroky na inštaláciu Oracle
- KPI v Power BI
- Power BI IF Statement
- Čo je dopyt a typy dopytov Oracle