Ako nainštalovať Apache

Pred zadaním spôsobu inštalácie časti Apache by sme mali najprv získať všeobecný prehľad o Apache a o tom, ako sa používa vo vede údajov.

Čo je Apache?

Apache Web Server je HTTP server, ktorý predstavuje webové stránky návštevníkom prichádzajúcim na váš server. Takže ak chcete nasadiť webovú stránku pre firmu alebo svoju organizáciu, pravdepodobne by ste na to použili Apache.

Existujú aj iné servery HTTP, napríklad IIS, ale Apache je štandard, ktorý väčšina ľudí používa, či už sú v systéme Linux, Windows alebo Mac. Apache je predvolené nastavenie, ktoré používa väčšina ľudí, pretože je dobre známe, je veľmi spoľahlivé a je zadarmo.

Jedinou vecou, ​​ktorú si musíte uvedomiť v Apache, je to, že ako HTTP server, takže ak to nainštalujete na Linux alebo Windows alebo Mac, všetko, čo vám umožní, je predstaviť návštevníkom prichádzajúcim na váš server statické webové stránky. Ak teda kódujete webovú stránku HTML bez ďalších programovacích jazykov okrem jazyka JavaScript, môžete ju použiť iba so serverom Apache. Môžete pripojiť všetky svoje značky na server Apache a prezentovať ich svojim návštevníkom.

Ako Apache použil v Data Science?

Data Science je najžiadanejšou oblasťou štúdia v modernom svete. Vedec údajov je považovaný za najsexuálnejšiu prácu v 21. storočí, pretože profesionáli z rôznych odborov sa chcú učiť a stať sa vedcom údajov. Apache hrá kľúčovú úlohu v každom nadšencovi pre vedu o údajoch, pretože potrebuje dostatočné znalosti o ekosystéme Apache Hadoop.

Ekosystém Apache Hadoop

Úplne prvá vec je, že ekosystém Hadoop nie je jedným nástrojom. Nie je to programovací jazyk ani jednotný rámec. Je to skupina nástrojov, ktoré rôzne spoločnosti používajú v rôznych oblastiach na rôzne úlohy. Každý nástroj prejdeme jeden po druhom nižšie: -

  • Apache HDFS (Distribuovaný súborový systém Hadoop) je úložná jednotka spoločnosti Hadoop, ktorá dokáže ukladať štruktúrované, čiastočne štruktúrované a neštruktúrované údaje. HDFS má metadáta, ktoré udržiavajú protokolový súbor o uložených údajoch. Má dve komponenty - NameNode a DataNode.
  • Apache Yarn je vyjednávač zdrojov, ktorý vykonáva všetky činnosti spracovania, ako sú plánovanie úloh, prideľovanie zdrojov, atď. Má dve služby - prvý je správca zdrojov, ktorý plánuje aplikácie bežiace nad programom Yarn. Druhým je Správca uzlov, ktorý monitoruje využitie zdrojov .
  • Apache Map Reduce je komponent spracovania údajov spoločnosti Hadoop, ktorý spracováva veľké množiny údajov pomocou distribuovaných a paralelných výpočtov založených na funkciách Map, Sort a Shuffle a Reduce. Funkcia Mapy filtruje údaje, potom sa triedi a premiešava a na konci Zníženie funkcie agreguje a sumarizuje výsledok.
  • Ošípané Apache sa používajú väčšinou v ETL. Má dve časti - prasa latina a prasa runtime. Pig Latin je jazyk používaný na spracovanie údajov pomocou dotazu, zatiaľ čo Pig runtime je prostredie vykonávania. Jeden riadok prasacej latiny sa takmer rovná 100 riadkom kódu Map Reduce. Proces zahŕňa najprv načítanie údajov a potom ich zoskupenie, triedenie, filtrovanie a ukladanie do HDFS.
  • Apache Hive používa dotaz podobný SQL na analýzu údajov v distribuovanom prostredí. Má dve komponenty - príkazový riadok Hive a server JDBC / ODBC a použitý jazyk sa nazýva HiveQL.
  • Apache Mahout je knižnica strojového učenia napísaná v jazyku Java a používa sa na vytváranie aplikácií strojového učenia, ako je zoskupovanie, klasifikácia alebo regresia. Má rôzne algoritmy zabudované pre rôzne prípady použitia.
  • Apache HBase je databáza NoSQL napísaná v Jave, ktorá beží cez Hadoop. Je postavený na BigTable spoločnosti Google a dokáže spracovať všetky typy údajov.
  • Apache Sqoop je nástroj na príjem dát, ktorý sa používa na hromadný štruktúrovaný prenos údajov medzi RDBMS a Hadoop.
  • Apache Flume je ďalší nástroj na prijímanie údajov, ktorý sa používa na pološtrukturovaný a neštruktúrovaný prenos údajov medzi Hadoopom a inými zdrojmi údajov.
  • ZooKeeper je koordinátor, ktorý zabezpečuje koordináciu medzi rôznymi nástrojmi v ekosystéme Hadoop.
  • Apache Ambari je manažér klastra, ktorý zabezpečuje, riadi klastre Hadoop a monitoruje ich zdravie a stav.
  • Apache Tez je nový nástroj v ekosystéme Hadoop, ktorý urýchľuje spracovanie dotazov Hadoop.
  • Apache Presto je open source distribuovaný dotazovací stroj SQL, ktorý umožňuje cross-platformové dotazovacie schopnosti.
  • Apache HCatalog je systém správy metadát a tabuliek pre Hadoop, ktorý umožňuje interoperabilitu medzi nástrojmi na spracovanie údajov. Pomáha tiež používateľom vybrať si najlepšie nástroje pre svoje prostredie.
  • Apache Spark je najpoužívanejší a najpopulárnejší rámec medzi Data Scientist. Je to vysokorýchlostný klastrový počítačový systém, ktorý optimalizuje využitie zdrojov v prípade mnohých iteračných úloh. Poskytuje flexibilitu pre dávkové spracovanie aj analýzu údajov v reálnom čase.

Nižšie sú uvedené kroky na inštaláciu Apache

Doteraz sme sa dozvedeli o Apache a o tom, ako je užitočné pre každého, kto sa chce naučiť Data Science alebo Big Data Analytics. Teraz na základe krokov uvedených nižšie skomprimujeme a nainštalujeme apache na Windows.

  • Prejdite na https://httpd.apache.org/ a kliknite na odkaz Stiahnuť v časti Apache httpd 2.4.38 Released.

  • Dostanete sa na nasledujúcu stránku a potom kliknete na Súbory pre Microsoft Windows.

  • Kliknite na Apache Lounge.

  • Môžete si stiahnuť 32-bitový alebo 64-bitový súbor zip na základe operačného systému Windows. Tu si stiahneme 64-bitovú verziu. Kliknutím na zodpovedajúci odkaz .zip ho stiahnite.

  • Teraz to vyžaduje redistribuovateľné Visual Studio 2017 v jazyku C ++. Takže ho stiahneme z príslušného 32-bitového alebo 64-bitového odkazu

  • Po stiahnutí oboch súborov pôjdeme do stiahnutého umiestnenia a najprv nainštalujeme redistribuovateľné Visual Studio 2017 C ++. Dvakrát kliknite na súbor .exe.

  • Začiarknite políčko Súhlasím a kliknite na tlačidlo Inštalovať.

  • Prebieha inštalácia Apache.

  • Po dokončení dostanete správu, ako je táto. Dokončite inštaláciu kliknutím na tlačidlo Zavrieť.

  • Teraz prejdite do priečinka, kde si stiahnete zip súbor Apache. Kliknite pravým tlačidlom myši a vyberte výpis.

  • Teraz budeme mať vytvorený priečinok Apache24. Skopírujte tento priečinok na jednotku C a potom pridáme cestu k premenným systémového prostredia.

Prejdite na Vlastnosti systému -> karta Spresnenie -> Kliknite na tlačidlo Premenné prostredia nižšie.

  • V časti Premenné nájdite cestu a kliknite na Upraviť.

  • Kliknite na Prehľadávať -> Prejdite do priečinka Apache24 jednotky C -> Vyberte priečinok s binom -> Kliknite na tlačidlo OK.

  • Nainštalujeme Apache ako službu Windows. Spustite príkazový riadok ako správca. Zadajte httpd –k install a stlačte enter.

  • Skontrolujeme inštalačnú službu Apache. Kliknite na ikonu Windows a napíšte služby. Kliknite na aplikáciu Služby a vyhľadajte službu s názvom Apache24.

  • Ak chcete spustiť server Apache, kliknite naň pravým tlačidlom myši a kliknite na príkaz Spustiť. Stav sa zmení na „Beží“.

  • Môžeme testovať pomocou prehliadača. Otvorte prehliadač a prejdite na adresu http: // localhost a stlačte kláves Enter. Správa s informáciou „Funguje to!“ sa objaví, aby sa potvrdila úspešná inštalácia Apache.

Odporúčané články

Toto bola príručka o tom, ako nainštalovať Apache. Tu sme diskutovali pokyny a rôzne kroky na inštaláciu Apache. Viac informácií nájdete aj v nasledujúcom článku -

  1. Apache Interview Otázky
  2. Apache Spark vs Apache Flink
  3. Apache Hadoop vs Apache Spark
  4. Apache Kafka vs Flume
  5. Kafka vs Kinesis Hlavné rozdiely

Kategórie: