Úvod k otázkam a odpovediam na rozhovor Hbase

HBase je populárny systém správy databáz NoSQL orientovaný na stĺpce, ktorý beží nad systémom Hadoop Distributed File System (HDFS). Je vhodný pre riedke súbory údajov, ktoré sú bežné v mnohých prípadoch použitia veľkých dát.

Tu je 10 najčastejšie kladených otázok a odpovedí na otázky týkajúce sa rozhovoru s firmou HBase 2019: Takže ste konečne našli prácu snov v službe HBase, ale zaujíma vás, ako rozlúštiť rozhovor s Hbase a aké by mohli byť pravdepodobné otázky týkajúce sa rozhovoru s Hbase. Každý pohovor je iný a rozsah zamestnania je tiež odlišný. S ohľadom na to sme navrhli najbežnejšie otázky a odpovede týkajúce sa rozhovoru Hbase, ktoré vám pomôžu dosiahnuť úspech v pohovore. Tieto otázky sú rozdelené na dve časti:

1. časť - Otázky týkajúce sa rozhovorov s HBase (základné)

Táto prvá časť obsahuje základné otázky a odpovede týkajúce sa rozhovorov s HBase.

1. Kedy používať HBase?

odpoveď:
Hbase nie je vhodný pre všetky prípady použitia.Najvhodnejší scenár je možné identifikovať pomocou nasledujúcich kontrol -
i.Data zväzok: Mali by byť spracované petabajty údajov v distribuovanom prostredí.
ii.Aplikácia: HBase nie je vhodná pre systémy OLTP (Online Transaction Processing), ktoré vyžadujú zložité transakcie s viacerými príkazmi.Je tiež postrádaná komplexná podpora SQL, ktorá sa vyžaduje pre relačnú analýzu. Je to uprednostňované, ak máte obrovské množstvo údajov s trochu odlišná schéma.
iii.Klastový hardvér: HBase beží na vrchole HDFS. A HDFS efektívne pracuje s veľkým počtom uzlov (minimálne 5). Takže HBase môže byť dobrý výber iba s dobrou hardvérovou podporou.
iv.Not Tradičné RDBMS: Hbase nemôže podporovať žiadny prípad použitia, ktorý vyžaduje tradičné funkcie, ako je spojenie viacerých tabuliek, zložité SQls s vnorenými funkciami alebo funkciami okna atď.
v.Rýchly náhodný prístup k údajom: Ak potrebujete náhodný prístup k svojim údajom v reálnom čase, potom je HBase vhodným kandidátom. Je tiež dokonalým riešením pre ukladanie veľkých tabuliek s viac štruktúrovanými údajmi.

2. Aký je rozdiel medzi Cassandrou a HBase?

odpoveď:
HBase aj Cassandra distribuovali databázu NoSQL pre veľké dáta z ekosystému Hadoop. Obe sú vyrobené pre rôzne prípady použitia.
HBase má druh architektúry typu master-slave s niekoľkými komponentmi, ako je Zookeeper, Namenode, HBase Master (Hmaster) a dátové uzly atď. Cassandra zaobchádza so všetkými uzlami ako s nadradenými, čo znamená, že všetky uzly sú rovnaké a vykonávajú všetky funkcie.
HBase je optimalizovaná na čítanie, zápis sa deje iba v hlavnom uzle a má silnú konzistenciu pri čítaní po zápise. Ak je zvolená možnosť konzistencie, Cassandra má vynikajúci výkon pri čítaní v jednom riadku.
Hbase natívne nepodporuje sekundárne indexy, Cassandra podporuje sekundárne indexy v rodinách stĺpcov, kde je známy názov stĺpca.
Spočiatku je Hbase vytvorená v Google a nazýva sa BigTable. Aj teraz sú API Bigtable a HBase kompatibilné. Pôvod Cassandry je z príspevku pre DynamoDB, čo je NoSQL databáza od AWS.

Prejdime k ďalším otázkam týkajúcim sa rozhovoru s HBase.

3. Ktoré sú hlavné zložky Hbase?

odpoveď:
HBase a má tri dôležité komponenty - HMaster, Region Server a ZooKeeper.
i.Hase Master - HBase Tabuľky sú rozdelené do regiónov. Počas spúšťania Master rozhoduje, ktorá oblasť sa má priradiť ku ktorému serveru v oblasti (server v oblasti bude uzlom v klastri). Zaoberá sa tiež operáciami metadát tabuľky, ako je vytvorenie alebo zmena schémy. Táto súčasť tiež hrá dôležitú úlohu pri odstraňovaní porúch
ii. Region Server - Ako je uvedené vyššie, v tomto prípade dochádza k zápisu a čítaniu skutočných údajov. Toto sú skutočné uzly klastra. Toto bude mať oblasti mnohých tabuliek, o ktorých sa rozhoduje na začiatku a na konci kľúčov riadkov. Typický server regiónu môže obsluhovať až tisíc regiónov
iii.ZooKeeper - ZooKeeper je klastrový koordinačný rámec široko používaný v ekosystéme Hadoop.Zookeeper sleduje všetky servery (servery Master a region) prítomné v klastroch HMaster kontakty ZooKeeper a oznámenia sa generujú v prípade výskytu chýb.

4. Čo je to filter HBase Bloom?

odpoveď:
Toto sú bežné otázky týkajúce sa rozhovoru s HBase počas rozhovoru. Filter HBase Bloom je efektívny mechanizmus na testovanie toho, či je úložný súbor (Keď sa niečo zapíše do HBase, najskôr sa zapíše do úložiska v pamäti, keď tento memstore dosiahne určitú veľkosť, je vyprázdnený na disk do úložného súboru. ) obsahuje konkrétny riadok alebo bunku riadok-stĺpec. Normálne je jediným spôsobom, ako sa rozhodnúť, či je kľúč riadku prítomný v úložnom súbore, skontrolovať index súboru bloku, ktorý má počiatočný kľúč riadku každého bloku v úložnom súbore. Blokové filtre fungujú ako dátová štruktúra v pamäti, ktorá pomáha obmedziť čítanie disku iba na súbory, ktoré pravdepodobne obsahujú tento riadok - nie všetky ukladané súbory. Takže to funguje ako index v pamäti, čo naznačuje pravdepodobnosť nájdenia riadku v konkrétnom ukladacom súbore.

5. Čo je stlačenie? Vysvetlite jej rôzne typy.

odpoveď:
Spoločnosť HBase ukladá všetky prijaté operácie do svojej oblasti pamäte pamäte. Keď je vyrovnávacia pamäť pamäte plná, prepláchne sa na disk. Pretože to môže v HDFS vytvoriť veľa malých súborov, spoločnosť HBase môže z času na čas vybrať súbory, ktoré sa majú spojiť do väčšieho. Zhutnenie sa nazýva menšie, keď si HBase zvolí zhutnenie iba niektorých HFilov, ale nie všetkých. Pri väčšom zhutňovaní sú všetky súbory vybrané na zhutnenie. Hlavné zhutnenie funguje ako menšie, s výnimkou toho, že značky odstránenia môžu byť odstránené po ich použití na všetky súvisiace bunky a všetky ďalšie verzie tej istej bunky budú tiež zrušené.

2. časť - Otázky týkajúce sa rozhovorov s HBase (rozšírené)

Pozrime sa teraz na pokročilé otázky týkajúce sa rozhovoru s HBase.

6.Ako sú údaje verzie HBase?

odpoveď:
Keď vložíte / aktualizujete / odstránite časť údajov, HBase vytvorí novú verziu pre tento stĺpec. K skutočnému vymazaniu dôjde iba počas zhutnenia. Ak konkrétna bunka prekročila povolený počet verzií, počas kompilácie budú vyradené ďalšie verzie

7. Aký je rozdiel medzi získaním a skenovaním?

odpoveď:
Get vráti iba jeden riadok z tabuľky Hbase na základe zadaného kľúča riadku. Príkaz Scan vráti sadu riadkov v závislosti od daných podmienok vyhľadávania. Zvyčajne je rýchlejší ako skenovanie. Ak je to možné, mali by ste to radšej použiť.

Prejdime k ďalším otázkam týkajúcim sa rozhovoru s HBase.

8. Čo sa stane, keď vymažete riadok?

odpoveď:
V čase vymazania nie sú údaje príkazov fyzicky vymazané zo súborového systému, namiesto toho sú neviditeľné nastavením značky. K fyzickému odstráneniu dochádza počas zhutnenia
Značky na odstránenie stĺpcov, verzií a rodín sú tri rôzne typy značiek, ktoré označujú vymazanie stĺpca, verzie stĺpca a rodiny stĺpcov.

9. Vysvetlite rozdiel medzi HBase a Hive.

odpoveď:
Toto je pokročilá otázka rozhovoru s HBase, ktorá bola položená počas rozhovoru. HBase a Hive sú úplne odlišné technológie založené na technológii Hadoop na spracovanie údajov. Hive je distribuovaný úložný rámec kompatibilný s SQL, porovnateľný s SQL, zatiaľ čo HBase je úložisko kľúčov a hodnôt NoSQL. Úľ slúži ako abstrakčná vrstva v hornej časti Hadoopu s podporou SQL. Vzor prístupu k údajom je veľmi obmedzený dvoma primárnymi operáciami get-get a scan. HBase je ideálna pre spracovanie údajov v reálnom čase, kde Hive je ideálnou voľbou pre dávkové spracovanie dát.

10. Čo sú Hlog a HFile?

odpoveď:
HLog je protokolový súbor s možnosťou zápisu, známy tiež ako WAL a HFile je skutočný súbor na ukladanie údajov. Dáta sa najskôr zapíšu do zapisovacieho logovacieho súboru a zapíšu sa aj do MemStore.Once MemStore je plný, obsah MemStore sa prepláchne na disk do HFiles.

Odporúčaný článok

Toto bol sprievodca zoznamom otázok a odpovedí na Hbase Interview, aby uchádzač mohol ľahko zakročiť proti týmto otázkam na Hbase. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Užitočné skupinové rozhovory
  2. Dôležité základné tipy na rozhovor
  3. Základné kroky na prípravu na pohovor
  4. Otázky na pohovor s uchádzačom o financie

Kategórie: