Úvod do tabuľky úľov

Kľúčové slovo „DROP“ označuje odstránenie. Na vymazanie údajov požadujeme, aby boli údaje v úli prítomné.

V Hadoope máme dve funkcie:

  1. Úložisko dát
  2. Spracovanie dát

Pri ukladaní údajov prichádza do obrazu HDFS (Hadoop Distributed File System). Keď teraz hovoríme, že máme v úľovej tabuľke údaje, znamenajú to dve veci:

  1. Údaje sú vo formáte HDFS
  2. V tomto súbore HDFS sme vytvorili tabuľku úľov a údaje z tohto súboru HDFS načítame do tabuľky úľov.

Takže v podstate, aby tabuľka rozloženia úľov mala údaje, je dátový súbor nevyhnutným predpokladom. V tomto článku sa dozvieme, ako zrušiť tabuľky v úli, čo sa stane, keď sa tabuľka zruší, a všetky veci súvisiace s tabuľkou v úli.

Typy drop tabuľky v úli

V úli sú dva typy tabuliek:

  1. Interná tabuľka alebo spravovaná tabuľka
  2. Externá tabuľka alebo nespravovaná tabuľka

Spravovaná tabuľka / interná tabuľka:

  1. V Hive je user / hive / Veľkoobchod predvolený adresár. V tomto priečinku sú predvolene uložené interné tabuľky. Pri vytváraní tabuľky nemusíme zadávať polohu manuálne.
  2. Príkaz „Drop table“ natrvalo odstráni údaje.
  3. Úľ spravuje všetku bezpečnosť pre spravované tabuľky.

V adresári „user / hive / Veľkoobchod“ sa už nachádza tabuľka s názvom „kódy“.

Na kontrolu, či je existujúca tabuľka spravovaná alebo nespravovaná, môžeme použiť nasledujúci príkaz:

Syntax príkazu:

Opíšte formátovaný názov tabuľky;

Výkon:

Pozrime sa na údaje uvedené v tabuľke „kódy“.

Najprv pomocou príkazu

Po druhé, pomocou Hue (Hadoop User Experience a Web UI)

Príkaz Delete: Drop table table_name;

Výkon:

Teraz, ak chcem vybrať údaje z „kódov“, bude to chyba, pretože tabuľka sa odstráni.

Túto tabuľku nebude možné vidieť ani v predvolenom adresári, ktorý je

"User / úľ / sklad"

Pozorujte tu,

Nespravovaná tabuľka / externá tabuľka:

  1. Externé tabuľky, sme povinní poskytnúť cestu, kam musíme túto tabuľku uložiť pomocou kľúčového slova „umiestnenie“ v príkaze na vytvorenie tabuľky.

Napríklad:

VYTVORIŤ EXTERNÚ TABUĽKU stg_s2_json.products

(reťazec bez názvu produktu, reťazec názvu produktu, popisný reťazec, aktívny reťazec, vytvorený reťazec dátumu, aktualizovaný reťazec dátumu) riadkový formát oddelených polí zakončených znakom „, “

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Úľ odstráni iba metaúdaje. Údaje sú trvalé.
  2. Tieto tabuľky by mohol používať ktokoľvek, kto má prístup k HDFS, takže musí spravovať zabezpečenie na úrovni priečinkov.

Na pochopenie zrušenia externej tabuľky použijeme tabuľku „produkty“.

Skontrolujte, či je tabuľka interná alebo externá. Príkaz „opíšte formátovaný názov tabuľky“.

Pri výbere príkazu dodržte „limit 10“. Tabuľka Výrobky obsahuje nasledujúce údaje:

Ak to chcete skontrolovať v Hue, vyzerá to takto:

Uvidíme, čo sa stane, keď zrušíme túto tabuľku:

syntaxe:

Drop table table_name;

Výkon:

Ak sa teraz pokúsite načítať údaje tabuľky, vyvolá to chybu.

Najprv mi pomocou príkazu „select“ na termináli vyvolá chybu, čo znamená, že metadáta pre externú tabuľku sa odstránia.

Pozorujte tu chybu:

Po druhé, kontrola stavu odtieňov údajov, súbor „products.json“ je stále v HDFS, čo znamená, že údaje sú trvalé.

záver

Uľahčím vám to a poskytnem vám kľúčové body pre oba druhy tabuliek. Vy rozhodujete, ktorý typ bude vyhovovať vašim požiadavkám.

Interná tabuľka

Externá tabuľka

Tiež sa nazýva „Spravovaná tabuľka“Nazýva sa tiež „Nespravovaná tabuľka“
Nie je potrebné zadávať polohu, predvolený adresár Hive spravuje tieto údajePotreba poskytnúť polohu
Odstráni metadáta tabuľky aj (údaje sú dočasné)Úľ ponechá údaje nedotknuté (údaje sú trvalé)
Samotný úľ riadi bezpečnosť stolaPotreba spravovať zabezpečenie na úrovni priečinkov

Odporúčané články

Toto je sprievodca tabuľkou úľov. Tu diskutujeme o zavedení Hive Drop Table, Typy Drop Table v Hive pozdĺž Syntax. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je Úľ?
  2. Architektúra úľa
  3. Príkazy úľa
  4. Čo je Oracle Database
  5. Usporiadať úľ podľa
  6. Inštalácia úľa

Kategórie: