Úvod do otázok a odpovedí z rozhovoru s ETL

Obchodné informácie a údaje sú najdôležitejšími vecami v dnešnej dobe. Analýza všetkých údajov a integrácia týchto výsledkov získala obrovský potenciál na trhu. Existuje mnoho nástrojov na testovanie ETL, ktoré pomáhajú pri organizovaní a zjednodušovaní procesu. Testovanie ETL musí mať dobre definovanú stratégiu, ktorá celý tento proces uľahčí. Tento proces zahŕňa analýzu požiadavky, validáciu a odhad testu, plánovanie testovania a navrhovanie testovacieho prostredia, prípravu a vykonanie testovacích údajov a vytvorenie súhrnnej správy. Proces extrakcie, transformácie a zaťaženia si vyžaduje množstvo analýz, a preto si vyžaduje správne testovanie. Nasledujúce otázky vám poskytnú prehľad o všetkých otázkach, ktoré môžete položiť pri pohovore.

Teraz, ak hľadáte prácu, ktorá súvisí s testovaním ETL, musíte sa pripraviť na otázky týkajúce sa rozhovoru s testovaním ETL v roku 2019. Je pravda, že každý pohovor sa líši podľa rôznych profilov zamestnania. Tu sme pripravili dôležité otázky a odpovede týkajúce sa rozhovorov s testovaním ETL, ktoré vám pomôžu dosiahnuť úspech v pohovore.

V tomto článku o otázkach týkajúcich sa rozhovorov s testovaním ETL v roku 2019 predstavíme 10 najdôležitejších a často používaných otázok na pohovor s testovaním ETL. Tieto otázky sú rozdelené na dve časti:

1. časť - Otázky na pohovory týkajúce sa skúšok ETL (základné)

Táto prvá časť sa venuje základným otázkam a odpovediam na testovanie rozhovorov ETL

Q1. Čo je ETL a vysvetlite, prečo sa vyžaduje testovanie ETL?

odpoveď:
ETL je skratka pre extrakt, transformáciu a zaťaženie. Tento proces sa vykonáva pre údaje, ktoré sa používajú na analýzu a predpovedanie budúcnosti akéhokoľvek podnikania. Extrahovanie znamená lokalizáciu údajov a odstránenie všetkých údajov zo zdrojového súboru. Transformácia je proces prenosu údajov do ktoréhokoľvek požadovaného súboru a načítania tohto súboru do cieľového systému vo formáte, ktorý je požadovaný alebo použiteľný. Potreba testovania ETL vzniká, keď potrebujeme sledovať údaje, ktoré sa transformujú z jedného systému na druhý. Musíme tiež skontrolovať efektívnosť a rýchlosť celého tohto procesu. Testovanie ETL zaisťuje, že všetky implementované dáta zodpovedajú požiadavkám klienta a poskytujú potrebný výstup.

Q2. Čo je náhradný kľúč?

odpoveď:
Náhradný kľúč možno označiť ako jedinečný identifikátor, ktorý sa môže použiť na modelovanie entity alebo objektu. Môže to byť jedinečný kľúč, ktorého význam má byť primárnym identifikátorom akéhokoľvek objektu alebo entity, ktorý nie je odvodený od žiadnej inej databázy a nemôže byť použitý ako primárny kľúč. Náhradným kľúčom môže byť jedinečné poradové číslo. Náhradný kľúč nie je vždy primárnym kľúčom a zvyčajne závisí od databázy. Vyberie, či je databáza aktuálna alebo dočasná. Ak je databáza aktuálna, ukladá aktuálne údaje a musí mať v údajoch vzájomný vzťah. Pokiaľ ide o dočasnú databázu, medzi primárnym a náhradným kľúčom môže existovať mnohostranný vzťah.

Prejdime k ďalším otázkam týkajúcim sa rozhovorov s ETL.

Q3. Vysvetlite, čo je rozdelenie a vysvetlite typy oddielov?

odpoveď:
Aby sa zlepšil výkon, sú existujúce transakcie rozdelené a tento proces je známy ako rozdelenie na oddiely. Rozdelenie disku pomáha Informatica Serveru vytvárať rôzne pripojenia k rôznym zdrojom. Typy oddielov sú:
Rozdelenie na kruhové oddiely: Všetky údaje sú rovnomerne rozdelené medzi všetky oddiely. Vo všetkých týchto oddieloch, keď je počet riadkov približne rovnaký, sa použije toto rozdelenie.
Hash Partitioning: V tomto rozdelení sú všetky kľúče rozdelenia rozdelené do skupín, ktoré používajú hash funkciu. Používa sa na zabezpečenie toho, aby spracovaná skupina riadkov s rovnakým rozdeľovacím kľúčom mala rovnaké oddiely.

Q4. Aké sú spôsoby aktualizácie tabuľky pri používaní SSIS?
odpoveď:
Toto sú bežné otázky týkajúce sa testovania rozhovorov ETL, ktoré boli položené počas rozhovoru. Nižšie nájdete rôzne tabuľky, ktoré sú podporované testovaním ETL. Pri aktualizácii tabuľky pomocou SSIS je možné vykonať tieto kroky:

  • Použite príkaz SQL
  • Na uloženie údajov o scéne použite tabuľku na odkladanie
  • Použite vyrovnávaciu pamäť na ukladanie údajov, ktoré využívajú obmedzený priestor a vyžadujú časté obnovovanie
  • Na plánovanie úloh použite skripty
  • Na aktualizáciu MSSQL použite úplný názov databázy.

Q5. Čo je to oddychová plocha a aký je jej účel?

odpoveď:
Staging dát je zvyčajne súbor procesov, ktoré sa používajú na prípravu zdrojových systémových údajov. Tieto dáta sa potom načítajú do dátového skladu. Staging údajov zahŕňa nasledujúce kroky:

Extrakcia zdrojových údajov a transformácia údajov v prípade reštrukturalizácie údajov podľa požiadaviek zákazníka. Transformácia údajov zahŕňa proces čistenia údajov a transformácie hodnôt. Zahŕňa tiež proces náhradných kľúčových úloh.

2. časť - Rozhovory s otázkami skúšania ETL (rozšírené)

Pozrime sa teraz na pokročilé otázky týkajúce sa rozhovorov s ETL.

Q6. Vysvetlite rozdiel medzi testovaním ETL a testovaním databázy?

odpoveď:
Rozdiel medzi testovaním ETL a testovaním databázy je uvedený nižšie:

  • Testovanie ETL sa zvyčajne zameriava na vykazovanie podnikových informácií, zatiaľ čo testovanie databáz zahŕňa integráciu údajov.
  • Nástroje, ktoré sa používajú na testovanie ETL, sú Cognos, QuerySurge a Informatica, zatiaľ čo QTP a selén sa používajú na automatizáciu testovania databázy.
  • Analýza údajov v ETL má potenciálny vplyv na údaje. Normálne testovanie databázy má dopady na implementáciu architektúry
  • Testovanie ETL má deformované údaje, zatiaľ čo testovanie databázy používa normalizované údaje.

Q7. Čo je to fakt? Vysvetlite druhy faktov?

odpoveď:
Skutočnosť je ústrednou súčasťou viacrozmerného modelu, ktorý pozostáva z opatrení, ktoré sa majú analyzovať. Fakty súvisia s rôznymi rozmermi.

Typy faktov sú uvedené nižšie:
Aditívum: Miera môže vykonávať aritmetické výpočty pomocou všetkých alebo niektorých dimenzií.
Polo aditívum: V tomto type môže opatrenie vykonať aritmetický výpočet pomocou iba niektorých rozmerov.
Non aditívne: Miera sa nemôže podieľať na aritmetických funkciách pomocou dimenzie.

Prejdime k ďalším otázkam týkajúcim sa rozhovorov s ETL.

Q8. Aký je rozdiel medzi náhradným kľúčom a primárnym kľúčom?

odpoveď:
Hovorí sa, že náhradný kľúč má postupne generované čísla, ktoré nemajú žiadny význam. Používa sa iba na jedinečnú identifikáciu riadkov. Na druhej strane primárny kľúč sa používa na jedinečnú identifikáciu riadkov. Je viditeľný pre používateľov a môže sa meniť podľa požiadaviek.

Q9. Definujte pojem pomaly sa meniaca dimenzia.
odpoveď:
Toto sú najčastejšie kladené otázky týkajúce sa rozhovorov s ETL pri pohovore. Pomaly sa meniace dimenzie sú tie, ktoré majú tendenciu sa meniť veľmi pomaly. Údaje v týchto dimenziách sa pomaly menia. Príkladom tejto dimenzie môže byť mesto alebo zamestnanec.
Riadky v týchto údajoch v rozmeroch môžu byť úplne nahradené bez toho, aby mali záznam o trase, alebo je možné vytvoriť alebo vložiť nový riadok. Pomocou tohto je možné sledovať aj pomalé zmeny.

Q10. Vysvetlite pojem vyčistenie údajov?

odpoveď:
Vymazanie časti údajov z dátového skladu sa nazýva čistenie dát. Tieto údaje, ktoré sa vymažú, sú zvyčajne údaje, ktoré majú riadky s nulovými hodnotami alebo medzery, ktoré je potrebné vyčistiť. Pri tomto procese sa čistenie tohto druhu odpadu alebo odpadu nezmení.

Odporúčaný článok

Toto bol sprievodca zoznamom otázok a odpovedí na otázky týkajúce sa testovania ETL, aby uchádzač mohol ľahko vykonať tvrdé zásahy do týchto otázok. Tu v tomto príspevku sme študovali najčastejšie otázky týkajúce sa rozhovorov s testovaním ETL, ktoré sa často kladú pri rozhovoroch. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. 10 základných otázok o rozhovoroch s Power Bi
  2. Otázky týkajúce sa rozhovoru PowerShell - najužitočnejšie
  3. Top 10 otázok MicroStrategy Interview
  4. Rozhovor s JIRA

Kategórie: