Prehľad AWS RedShift
AWS poskytuje veľa funkcií, ktoré nám uľahčujú prácu. V tejto téme sa dozvieme, čo je AWS Redshift a niektoré z technológií AWS Redshift, ktoré sú uvedené nižšie: -
- Amazon EC2
- Amazon RDS
- Amazon S3
- Amazon CloudFront
- Amazon Auto Scaling
- Amazon Lambda
- Amazon Redshift
Jednou z hlavných služieb, ktoré poskytuje AWS a budeme sa zaoberať, je Amazon RedShift. Čo je to RedShift, na čo sa používa, to sú základné otázky, ktoré prichádzajú do našej mysle vždy, keď si to prečítame. podrobne si teda skontrolujte, čo je redshift a na čo sa používa. RedShift je služba na úrovni podniku, petabyte a plne riadená služba skladovania dát.
Čo je to dátový sklad? Odpoveď na bývanie je sama osebe, ak vieme, čo je sklad všeobecný, spravidla je sklad miestom, kde môžu byť suroviny alebo vyrobené tovary uskladnené pred ich distribúciou na predaj, to isté platí pre údaje, aj dátový sklad je miesto na zhromažďovanie, ukladanie a správu údajov z rôznych zdrojov a poskytovanie relevantných a zmysluplných obchodných poznatkov. Amazon teda poskytuje nástroj skladovania na podnikovej úrovni, kde môžeme spracovávať a spravovať údaje pomocou REDSHIFT. Rozsah týchto súborov údajov sa pohybuje od 100 s do gigabajtov po petabajt.
Dôvody použitia AWS RedShift
Preto sa často stretávame so všeobecnou otázkou, že pred týmto nástrojom AWS, kde bol tento sklad, kde sme robili všetky tieto údaje, ich ukladanie a výrobu. Takže skôr, keď bolo načítanie údajov úplne normálne, používali sme fyzické servery, databázy, ktoré sa používali na sledovanie údajov a ich spracovanie, ale keďže došlo k exponenciálnemu nárastu veľkosti dotazovania a spracovania údajov, stala sa náročnou úlohou dotazy začali trvať dlho, ako sa očakávalo.
Tu sme narazili na potrebu amazonského redshift, ktorý bol oveľa rýchlejší s veľmi vysokým výkonom a škálovateľnosťou na ukladanie a výrobu dát. Prišiel s obrovskou úložnou kapacitou a transparentnou cenou a zabezpečený proti rôznym porušeniam údajov. Podporujúc rozhrania SQL a rôzne ovládače ODBC / JDBC, je pomerne jednoduché použitie a dobre sa zlúčili s ostatnými službami Amazonu.
Pracovanie AWS RedShift
Teraz sa pozrime na schému architektúry Redshift a pokúsime sa pochopiť, ako vlastne RedShift funguje -
- Nasledujúca schéma zobrazuje fungovanie Amazon RedShift. Pozrime sa na to:
- Pre spojenie s klientskou aplikáciou máme niekoľko ovládačov, ktoré sa pripájajú k Redshift.
- V rámci Redshift môžeme vytvoriť viac ako jeden klaster a každý klaster môže hostovať viac databáz.
- Uzly sú rozdelené do segmentov, pričom každý segment má dáta.
- Z dostupných uzlov, ak máme viac ako jeden uzol, sa vyberie ako Leader, ktorý bude hlavným zdrojom pre komunikáciu klienta. Klientská aplikácia bude hovoriť iba s vedúcim uzlom, vedúci uzol je zodpovedný za prijímanie otázok a príkazov z klientskeho programu.
- Akonáhle vedúci uzol začne získavať dopyty vykonávané klientom, začne analyzovať dotaz a vytvára plán na jeho spustenie na iných výpočtových uzloch. Keď je proces distribuovaný do príslušných uzlov, čaká na konečný výsledok z uzlov a potom ho vráti klientovi.
- Môžeme pridať počet uzlov a tiež môžeme zvýšiť pamäť s rastúcim zaťažením údajov.
- Výpočtové uzly majú samostatnú sieť, ku ktorej klient nemá prístup, čo ju tiež zaisťuje.
- Existujú dva typy uzlov: Hustý úložný uzol a Hustý výpočtový uzol, kapacita pamäte sa môže pohybovať od 160 GB do 16 TB
Takže tu sme videli základnú architektúru toho, ako REDSHIFT funguje. Teraz prejdeme k tomu, ako používať Aws Redshift.
Používanie AWS RedShift -
Pre prácu s AWS Redshift musíme vykonať niektoré základné kroky uvedené nižšie: -
1) Prihláste sa do služby AWS a vytvorte si tam účet. (Ak nie)
2) Prejdite na konzolu Amazon Redshift pomocou nasledujúceho odkazu: -
https://console.aws.amazon.com/redshift/
3) Teraz musíme vytvoriť úlohu I AM, ktorú musíme prejsť na odkaz uvedený nižšie: -
https://console.aws.amazon.com/iam/
- Choďte do rolí
- Vyberte vytvorenie rolí.
- V službe AWS zvoľte Redshift
- Vyberte možnosť Redshift - Prispôsobiteľné a potom možnosť Ďalej: Povolenia v rámci prípadu použitia.
- Nastavte hranice povolenia
- Zadajte názov svojej úlohy
- Skontrolujte a vytvorte úlohu.
4) Teraz musíme vytvoriť klaster výberom ponuky regiónov v konzole.
- Vyberte oblasť, kde sa vytvára klaster.
- Kliknite na Spustiť.
- Musíme vyplniť niekoľko podrobností, ako napríklad názov databázy, heslo a skontrolovať tlačidlo Pokračovať
- Akonáhle je klaster viditeľný, skontrolujte to v zozname a skontrolujte stavové informácie.
- Akonáhle budeme mať klaster s nami, musíme urobiť ďalšiu skupinu nastavení skupiny zabezpečenia. Tu musíme nastaviť zdroj a rozsah protokolu typu prichádzajúcich pravidiel.
- Skontrolujte požadovanú konfiguráciu a pripojte sa k klastru Redshift.
5) Keď skončíme so všetkými konfiguráciami súvisiacimi s klastrom, musíme sa teraz pripojiť k nášmu Redshift. K tomuto Redshiftu sa môžeme pripojiť priamo alebo prostredníctvom SSL. Na priame pripojenie je potrebné mať ovládače JDBC / ODBC, ktoré musíme nastaviť na konfiguračnej stránke klastra.
Po peknom vykonaní týchto niekoľkých konfigurácií sme pripravení používať Redshift.
Výhody AWS RedShift -
Prečo teda niekto bude používať AWS Redshift, musí existovať určitá výhoda oproti iným službám, vďaka ktorým je to špeciálne. Pozrime sa teda na niektoré z výhod používania funkcie Redshift.
- Vysoká rýchlosť : - Čas spracovania dotazu je pomerne rýchlejší ako v prípade iných nástrojov na spracovanie údajov a vizualizácia údajov má oveľa jasnejší obraz.
- Hromadné spracovanie údajov : - Čím väčší je redshift s veľkosťou dát, má schopnosť spracovať obrovské množstvo údajov v dostatočnom čase.
- Minimálna strata dát : - Pretože dáta sú distribuované v klastri a spracovávané paralelne v sieti, existuje minimálna šanca na stratu údajov a miera správnosti spracovaných údajov je lepšia.
- Nákladovo efektívne : - Keďže je nákladovo efektívny, je lacnejší ako akékoľvek iné dostupné alternatívy, vďaka ktorým je silný v porovnaní s priemyselným využitím. Keďže ceny sú nižšie, môžeme sa ubytovať s veľkým množstvom údajov a môžeme ich spracovať v rámci rozpočtu.
- Rozhranie SQL : - Modul Query založený na Redshift je rovnaký ako v prípade Postgres SQL, čo uľahčuje vývojárom jazyka SQL hrať sa s ním.
- Zabezpečenie : - Údaje v Redshift sú šifrované, ktoré sú dostupné na viacerých miestach v RedShift. Môžeme tiež definovať pravidlo prichádzajúcich a odchádzajúcich údajov, vďaka ktorým sú dáta oveľa bezpečnejšie.
Existuje oveľa viac výhod, keď sa redshift stane lepšou voľbou pre dátový sklad.
Ceny AWS RedShift -
RedShift prichádza s úžasným zoznamom cien, ktorý priťahuje vývojárov alebo trh k nemu. Keďže prichádza s funkciou stanovovania cien na požiadanie, môžeme ju použiť len cez hodinovú základňu a počet uzlov v našom klastri. Spectrum Pricing nám pomáha spúšťať dotazy SQL priamo proti všetkým našim údajom.
Môžeme vytvoriť veľké dátové sklady pomocou pevného disku za veľmi nízku cenu. Pre viac informácií o presných podrobnostiach o cenách si môžete pozrieť dokument uvedený nižšie spoločnosťou Amazon: -
https://aws.amazon.com/redshift/pricing/
Vyššie uvedený dokument obsahuje všetky podrobnosti o rôznych cenách pre AWS REDSHIFT.
záver
Z vyššie uvedeného článku, ktorý sme videli pre Redshift, musíme mať spravodlivú predstavu o tom, čo je vlastne redshift a jeho použitie. Keďže RedShift je veľmi škálovateľný a ľahko použiteľný, priemysel ho najviac prijíma na podporu rôznych ďalších technológií Amazonu, vďaka ktorým je výkonnejší. Takže na svete plnom údajov Redshift prichádza s veľmi dobrým balíkom skladovania a spracovania dát.
Odporúčané články
Toto je sprievodca, čo je AWS RedShift. Tu diskutujeme prácu, používanie a výhody AWS RedShift. Viac informácií nájdete aj v nasledujúcom článku -
- Architektúra AWS
- Čo je AWS?
- Čo je liek Azure?
- Čo je AWS Lambda?
- AWS Storage Services