Ab initio Interview Otázky a odpovede

Takže ste konečne našli svoju vysnívanú prácu v Ab initio, ale premýšľate, ako rozlúštiť Ab initio Interview a čo by mohlo byť pravdepodobné Ab initio Interview Otázky na rok 2018. Každý rozhovor je iný a rozsah zamestnania je tiež iný. S ohľadom na túto skutočnosť sme pre rok 2018 navrhli najbežnejšie otázky a odpovede týkajúce sa rozhovoru Ab initio, ktoré vám pomôžu dosiahnuť úspech v pohovore.

Nižšie sú uvedené najčastejšie otázky týkajúce sa rozhovoru Ab initio, ktoré sa často kladú počas rozhovoru. Tieto rozhovory sú rozdelené do dvoch častí:

1. časť Otázky na pohovor Ab initio (základné)

Táto prvá časť obsahuje základné otázky a odpovede týkajúce sa rozhovoru Ab initio.

1. Aké súčasti alebo funkcie sú k dispozícii na začiatku?

odpoveď:
Hlavné komponenty ab initio sú tu,

komponentovúčel
DedupOdstránenie duplikátov
pripojiťAk sa chcete pripojiť k viacerým vstupným súborom údajov na základe hodnoty spoločného kľúča.
druhTáto zložka zmení poradie údajov. Prevezme poradie zoradenia a uloží údaje do pamäte
filterAkékoľvek podmienené odstránenie údajov.
ReplicateToto je komponent, ktorý slúži hlavne na paralelizmus, pretože je užitočná ďalšia kópia údajov, zatiaľ čo iné uzly nie sú k dispozícii.
zlúčiťTáto zložka je kombináciou viacerých vstupných údajov.

2. Aké sú druhy paralelného spracovania?

odpoveď:
Toto sú bežné otázky týkajúce sa rozhovoru Ab initio, ktoré boli položené počas rozhovoru. Rôzne typy paralelného spracovania sú:

  1. Komponentový paralelizmus
  2. Dátový paralelizmus
  3. Potrubný paralelizmus

Paralelita s komponentmi: Aplikácia, ktorá v systéme beží súčasne viac komponentov. Údaje sú však oddelené. Toto sa dosiahne paralelným spracovaním na úrovni komponentov.

Paralelita s údajmi: Dáta sú rozdelené do segmentov a vykonávajú operácie súčasne. Tento druh procesu sa dosahuje pomocou dátového paralelizmu

Pipeline rovnobežnosť: Aplikácia s viacerými komponentmi, ale beží na rovnakom súbore údajov. Využíva sa tým paralelizmus potrubia.

3. Aký je rozdielny spôsob dosiahnutia priečok?

odpoveď:
Existuje niekoľko spôsobov, ako robiť oddiely.

priečkypopis
vyjadrenieRozdelenie údajov podľa jazyka manipulácie s údajmi.
kľúčZoskupovanie údajov podľa konkrétnych kľúčov
Vyváženie záťažeDynamické vyváženie zaťaženia
percentoOddeľte údaje, ak je výstupná veľkosť na zlomkoch 100
rozsahRozdeľte údaje rovnomerne na základe kľúča a rozsahu medzi uzlami
Guľatý RobinDistribúcia údajov rovnomerne v blokoch vo výstupných oddieloch.

Prejdime k ďalšiemu rozhovoru Ab initio Otázky.

4. Čo je to multifilný systém?

odpoveď:
Multifile je skupina adresárov na rôznych uzloch v klastri. Majú identickú štruktúru adresárov. Viacúčelový systém vedie k lepšiemu výkonu, pretože ide o paralelné spracovanie, v ktorom sa údaje nachádzajú na viacerých diskoch.

Je vytvorený s riadiacou oblasťou na jednom uzle a dátovými oddielmi na ostatných uzloch na distribúciu spracovania, aby sa zlepšil výkon.

5. Rozdiel medzi Hadoop a Ab initio?

odpoveď:

HadoopAb initio
Open sourceProprietárny softvér
Paralelné spracovanie pomocou mapovačov a reduktorovArchitektúra paralelného spracovania
Tu je najvhodnejšia akákoľvek rozmanitosť údajovNajlepšie pre tradičné implementácie EDW
Je dosiahnutá tolerancia porúchTolerancia porúch nie je dosiahnutá
MapReduce je riadený všetkými komponentmi alebo funkciamiKomponenty ako join, group, sort sú ľahko

vykonané

Lacný ako jeho otvorený zdroj a môže vyskúšať všetky prípady použitia v podnikaní.Drahé a použiteľné v obchodnom prípade s vysokou hodnotou kvôli nákladom
Voľne spojené komponenty, v ktorých sú vytvorené vlastné funkcieMedzi komponentmi sú pevne spojené, pretože sa na základe prípadu použitia v podniku odporúčajú.

2. časť - Otázky na rozhovor Interview (rozšírené)

Pozrime sa teraz na pokročilé otázky týkajúce sa rozhovorov Ab initio.

6. Aké rozloženia podporuje Ab initio?

odpoveď:

  • Podporuje sériové a paralelné rozloženie.
  • Grafické rozloženie podporuje sériové aj paralelné rozloženie súčasne.
  • Viacsúborový systém je 4-cestný paralelný systém
  • Komponent v grafickom systéme môže bežať 4-cestný paralelný systém.

7. Aký je vzťah medzi prostredím Enterprise metadata (EME), prostredím grafického vývoja (GDE) a spolupracujúcim systémom?

odpoveď:
Spolupracujúci systém: Funguje nad operačným systémom a poskytuje ho ab initio a je základom všetkých procesov Ab Initio. Letecké príkazy sú jednou z funkcií, ktoré je možné nainštalovať do rôznych operačných systémov, ako sú UNIX, Linux, IBM atď

Toto sú nasledujúce funkcie, ktoré poskytuje,
- Spravuje a spúšťa grafy Ab Initio a riadi procesy ETL
- Poskytovanie rozšírení
- Monitorovanie a ladenie procesov ETL
- Správa metaúdajov a interakcia s EME

GDE: Je to konštrukčná súčasť a používa sa na spustenie grafov ab initio.

Grafy tvoria komponenty (preddefinované alebo definované používateľom) a toky a parametre. Poskytuje proces ETL v Ab Initio, ktorý je reprezentovaný grafmi.

Schopnosť spúšťať, ladiť úlohy protokolov procesu a sledovať protokoly vykonávania

Enterprise Meta-Environment (EME): Je to prostredie na ukladanie a správu metadát (obchodné aj technické metadáta). K metaúdajom sa pristupuje z grafického vývojového prostredia a tiež z webového prehľadávača alebo spolupracujúceho príkazového riadku. Je to ab initio úložisko pre všetky zástupné symboly.

Prejdime k ďalším otázkam na rozhovor Ab initio.

8.Ako sa spracúvajú údaje a aké sú základy tohto prístupu?

odpoveď:
Existujú určité činnosti, ktoré si vyžadujú zozbieranie údajov a to najlepšie, čo sa spracúva, v mnohých prípadoch závisí od toho istého. Pred spracovaním údajov musí byť umiestnené na nejakom zástupnom symbole, ako je dobre definované úložisko. Táto úloha závisí od niektorých hlavných faktorov, ktoré sú

1. Zber údajov
2. Prezentácia
3. Konečné výsledky
4.Analýza
5.Sorting

9. Aký je rozdiel medzi rozdelením pomocou kľúča a okrúhlym robinom?

Odpoveď :
Toto sú pokročilé otázky týkajúce sa rozhovoru Ab initio, ktoré boli položené počas rozhovoru. Rozdelenie podľa kľúča
V tomto musíme určiť kľúč, na základe ktorého sa oddiel vytvorí. Výsledkom sú dobre vyvážené údaje vďaka kľúčovým oblastiam. Je to užitočné pre kľúčové závislosti
paralelizmus.
Partition by round robin: Pri tomto rovnomernom rozdeľovaní údajov v blokoch veľkosti blokov sú záznamy rozdelené sekvenčne cez výstupný oddiel. Nie je to kľúčové
založené a výsledky sú dobre vyvážené údaje, najmä s veľkosťou bloku 1. Je to užitočné
zaznamenávať nezávislý paralelizmus.

10. Ako zlepšujete výkonnosť grafu?

Odpoveď :
Existuje mnoho spôsobov, ako možno zlepšiť výkonnosť grafu.
1) Znížte použitie viacerých komponentov v určitých fázach.
2) Na triedenie a spájanie komponentov použite vylepšenú a dobre definovanú hodnotu maximálnych základných hodnôt
3) Minimalizujte použitie funkcií regulárnych výrazov, ako je re_index, v prenosových funkciách
4) Minimalizujte komponent triedeného spojenia a ak je to možné, nahraďte ho pripojením v pamäti / hash join
5) Pri triedení, preformátovaní a spájaní komponentov používajte iba povinné polia
6) Použitie fázy alebo vyrovnávacej pamäte toku v prípade zlúčenia alebo triedenia spojení
7) Použite hash join, ak sú dve sady vstupov malé, inak je lepšie zvoliť triedené spojenie pre veľkú vstupnú veľkosť
8) V prípade veľkého súboru údajov radšej nepoužívajte vysielanie ako rozdelené
9) Počas spracovania znížte počet triediacich komponentov.
10) Vyvarujte sa zbytočnému rozdeleniu údajov

Odporúčaný článok

Toto bol sprievodca zoznamom otázok a odpovedí na otázky týkajúce sa rozhovoru Ab initio, aby mohol kandidát ľahko vykonať zákrok s týmito otázkami na pohovor Ab initio. Tu v tomto príspevku sme študovali najčastejšie otázky týkajúce sa rozhovorov Ab initio Interview, ktoré sa často kladú pri rozhovoroch. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Otázky na rozhovor s Androidom - 10 najdôležitejších užitočných otázok
  2. Štatistika Interview Otázky | Užitočné a najčastejšie otázky
  3. Minitab Interview Otázky - Top 7 Užitočné otázky sa učiť
  4. Splunk rozhovory otázky a odpovede, ktoré by ste mali vedieť

Kategórie: