Úvod do otázok a odpovedí na otázky týkajúce sa skladovania údajov
Čo je to dátový sklad?
Dátový sklad je centrálny archív, ktorý ukladá heterogénne údaje z rôznych zdrojov. Údaje v sklade môžu byť použité na analytické výkazníctvo, štruktúrované alebo ad hoc dotazy a použité pri rozhodovaní. Proces zhromažďovania údajov z viacerých zdrojov a ich ukladania v centrálnom úložisku sa nazýva Data Warehousing.
Dáta môžu byť niekoľkých typov, ako sú štruktúrované, pološtrukturované alebo neštruktúrované údaje. Dáta z rôznych zdrojov sa spracúvajú, transformujú a prijímajú do jednej databázy, ktorá sa nazýva dátový sklad. Používatelia majú k týmto spracovaným údajom v dátovom sklade prístup prostredníctvom rôznych nástrojov, ako sú nástroje Business Intelligence, klienti SQL, tabuľky a mnoho ďalších nástrojov. Tieto údaje pomáhajú vykonávať operácie získavania údajov, ktoré pomáhajú nájsť určitý vzorec v údajoch.
Teraz, ak hľadáte prácu, ktorá súvisí s dátovým skladovaním, musíte sa pripraviť na otázky týkajúce sa rozhovoru o dátovom skladovaní v roku 2019. Je pravda, že každý pohovor sa líši podľa rôznych profilov zamestnania. Tu sme pripravili dôležité otázky a odpovede týkajúce sa rozhovoru o skladovaní údajov, ktoré vám pomôžu dosiahnuť úspech v pohovore.
Teraz pochopme niektoré z dôležitých otázok týkajúcich sa rozhovoru o softvéri na spracovanie údajov 2019, ktoré sa môžu opýtať na pohovore. To však neznamená, že toto sú jediné otázky, ktoré sa vás budú pýtať na pohovore, musíte byť dôkladne pripravení na každú tému, o ktorej tu diskutujeme. Tieto otázky sú rozdelené na dve časti:
1. časť - Rozhovor na skladovanie údajov (základné)
Táto prvá časť sa venuje základným otázkam a odpovediam na otázky týkajúce sa skladovania údajov
Q1. Čo je to skladovanie údajov?
odpoveď:
Data Warehousing je proces zhromažďovania údajov z rôznych zdrojov, ktoré ich spracúvajú a ukladajú do obrovskej databázy, takže spracované údaje by sa mohli použiť na rôzne účely, ako je analytické výkazníctvo, obchodné spravodajstvo alebo získavanie údajov atď. Základnou myšlienkou dátového skladu nie je nič ale ukladanie obrovského množstva údajov.
Q2. Rozdiel medzi databázou a dátovým skladom?
odpoveď:
Nižšie nájdete rôzne tabuľky, ktoré podporuje Data Warehousing:
databázy | Dátový sklad |
Zber údajov používaných na ukladanie, sprístupňovanie a vyhľadávanie | Zber údajov používaných na vykonávanie analýzy |
Obmedzené na jedinú aplikáciu | Môže byť použitý vo viacerých aplikáciách |
Ukladá normalizované údaje | Údaje nemusia byť normalizované zvyčajne uložené ako denormalizované údaje |
Na báze ER a aplikácie | snehová vločka alebo začnite podľa schémy a zamerajte sa na jednotlivé témy |
Používa sa na spracovanie transakcií | Používa sa na modelovanie a analýzu údajov |
Prejdime k ďalším otázkam týkajúcim sa rozhovoru o skladovaní údajov
Q3. Aké sú fázy ukladania údajov?
odpoveď:
Všeobecné fázy dátového skladu sú:
- Operačná databáza offline: Údaje sa skopírujú z operačného systému na iný server, aby sa mohli vykonávať rôzne operácie.
- Offline Data Warehouse: Údaje v Data Warehouse sa pravidelne aktualizujú z prevádzkovej databázy.
- Dátový sklad v reálnom čase: Dátový sklad sa aktualizuje, keď dôjde k akejkoľvek transakcii v operačnom systéme.
- Integrovaný dátový sklad: Dátový sklad sa aktualizuje nepretržite, keď sa v operačnom systéme vykonáva akákoľvek transakcia.
Q4. Čo je to Business Intelligence (BI)?
odpoveď:
Toto sú základné otázky týkajúce sa rozhovoru o skladovaní údajov, ktoré boli položené počas rozhovoru. BI je technologicky riadený proces na analýzu údajov a predkladanie zmysluplných poznatkov koncovým používateľom, ktoré pomáhajú pri lepšom rozhodovaní. BI zahŕňa rôzne nástroje, ktoré pomáhajú porozumieť trendom a vzorcom údajov skrytým v údajoch. Medzi najpoužívanejšie nástroje patria SAP Business Intelligence, MicroStrategy, Science, Tableau a mnoho ďalších.
Q5. Aké sú komponenty dátového skladu?
odpoveď:
Štyri komponenty dátového skladu sú:
- Správca načítania: Vykonáva všetky operácie spojené s extrahovaním a načítaním údajov do skladu.
- Správca skladu: Vykonáva operácie spojené s údajmi v sklade. Vykonáva operácie, ako je analýza údajov, aby sa zabezpečila konzistentnosť, tvorba indexov a zobrazení a mnoho ďalších operácií.
- Správca dopytov: Vykonáva všetky operácie súvisiace s užívateľskými dopytmi. Operácie tohto komponentu sú priame dotazy do príslušných tabuliek.
- Prístupový nástroj pre koncového používateľa: Nástroje používané koncovými používateľmi na prístup k údajom. Je rozdelený do rôznych skupín ako
- Nástroje na vykazovanie údajov
- Dotazovacie nástroje
- Nástroje na vývoj aplikácií
- Nástroje EIS
- Nástroje OLAP a Data mining
2. časť - Rozhovor na skladovanie údajov (rozšírené)
Pozrime sa teraz na pokročilé otázky týkajúce sa rozhovoru pri skladovaní údajov.
Q6. Čo je tabuľka dimenzií?
odpoveď:
Tabuľka dimenzií v dátovom sklade je tabuľka v schéme hviezd. Tabuľky dimenzií sa používajú na ukladanie dimenzií alebo atribútov, ktoré popisujú údaje v tabuľke faktov. Napríklad dimenzia produktu môže obsahovať názov, popis, jednotkovú cenu, hmotnosť, farbu a mnoho ďalších atribútov. Systém vygenerovaný kľúčom sa jednoznačne používa na identifikáciu riadku v tabuľke rozmerov. Tento kľúč slúži ako primárny kľúč v tabuľke rozmerov a v skutočnosti sa používa ako cudzí kľúč v skutočnosti, ktorý pomáha spájať tieto dve tabuľky.
Q7. Čo je tabuľka faktov?
odpoveď:
Tabuľka faktov je stredná tabuľka hviezdovej schémy, obklopená rozmerovou tabuľkou dátového skladu. Faktická tabuľka pozostáva z kvantitatívnych metrík alebo faktov obchodného procesu. Tabuľka faktov pracuje s tabuľkou dimenzií a ukladá údaje, ktoré sa majú analyzovať. Tabuľka faktov obsahuje stĺpec cudzieho kľúča, ktorý slúži ako primárny kľúč v rozmerovej tabuľke, ktorú tento kľúč umožňuje spájať medzi týmito dvoma tabuľkami.
Prejdime k ďalším otázkam týkajúcim sa rozhovoru o skladovaní údajov
Q8. Čo je Data Mart?
odpoveď:
Data Mart je podmnožina dátového skladu, ktorý zvyčajne obsahuje špecifickú množinu údajov týkajúcich sa konkrétnej obchodnej línie. Data Mart je malý a používa sa pri vyhľadávaní alebo analýze konkrétneho súboru údajov, napríklad údajov týkajúcich sa „predaja“, „zákazníkov“, „objednávky“ atď.
Q9. Čo je úložisko prevádzkových údajov (ODS)?
odpoveď:
Toto sú najčastejšie kladené otázky týkajúce sa rozhovoru o skladovaní údajov v rozhovore. ODS je typ databázy, ktorá ukladá údaje, ktoré používajú operačné systémy pred uložením do dátového skladu. Slúži ako prechodná databáza. ODS obsahuje krátkodobé údaje, zatiaľ čo dátový sklad obsahuje historické údaje.
Q10. Vysvetlite architektúru dátového skladu.
odpoveď:
Zahŕňa nasledujúce fázy:
- Vrstva zdrojov údajov: V tejto fáze sa údaje zbierajú z rôznych zdrojov a ukladajú sa do relačnej databázy. Údaje zahŕňajú údaje zo sociálnych médií, prevádzkové údaje, údaje o transakciách a mnoho ďalších.
- Vrstva postupovania údajov: V tejto fáze sa údaje zo vrstvy zdroja údajov extrahujú a spracúvajú, pretože údaje budú pochádzať z rôznych zdrojov a rôznych formátov. Extrahované údaje budú podrobené kontrole kvality a konečné výsledky budú čisté a usporiadané údaje, ktoré sa načítajú do dátového skladu.
- Vrstva na ukladanie údajov: Táto vrstva je miestom, kde sa budú ukladať údaje z pracovnej oblasti ako jeden centrálny archív. V závislosti od obchodných požiadaviek môže byť úložiskom dátový sklad, dátový server alebo úložisko prevádzkových údajov.
- Vrstva prezentácie údajov: Túto vrstvu používajú používatelia na prístup k údajom. Používatelia môžu vykonávať rôzne dotazy alebo spúšťať určité analýzy na vykonávanie prehľadov.
Odporúčaný článok
Toto bol sprievodca zoznamom otázok a odpovedí na otázky týkajúce sa skladovania údajov, aby uchádzač mohol tieto otázky týkajúce sa rozhovoru na skladovaní dát ľahko zahnať. Tu v tomto príspevku sme študovali najčastejšie otázky týkajúce sa rozhovoru o skladovaní údajov, ktoré sa často kladú pri rozhovoroch. Ďalšie informácie nájdete aj v nasledujúcich článkoch -
- RMAN Rozhovor Otázky a odpovede
- 10 najčastejších otázok o rozhovoroch s analytikmi údajov
- Najčastejšie otázky týkajúce sa rozhovoru s hibernáciou
- Otázky týkajúce sa rozhovoru PowerShell
- Kompletný sprievodca skladovaním údajov Oracle