Nainštalujte NLTK - Ako nainštalovať NLTK na Windows a Linux

Obsah:

Anonim

Ako nainštalovať NLTK?

Nasledujúci článok Inštalácia NLTK poskytuje prehľad pre inštaláciu NLTK. NLTK je sada knižníc pre spracovanie prirodzeného jazyka. Je to platforma na vytváranie programov Python na spracovanie prirodzeného jazyka. NLTK je napísaný v programovacom jazyku Python. Bol vyvinutý Stevenom Birdom a Edwardom Loperom. Podporuje výskum a výučbu v NLP alebo v úzko súvisiacich oblastiach, vrátane kognitívnej vedy, empirickej lingvistiky, získavania informácií, umelej inteligencie a strojového učenia. NLTK poskytuje ľahko použiteľné rozhranie.

NLTK (Natural Language Toolkit)

  • Spracovanie prirodzeného jazyka (NLP) je súčasťou umelej inteligencie, ktorá spracúva jazyk, ktorým hovoria ľudia. Pomáha tak ľuďom interagovať s počítačmi, aj keď nevedia, ako ich používať. Pomocou NLP musia ľudia diktovať príkaz počítačom. Vďaka schopnosti strojového učenia sa spracovanie prirodzeného jazyka stáva populárnejším a ľahšie implementovateľným. V podstate ide o techniku ​​interakcie s ľuďmi a vykonávania hlasových pokynov.
  • To umožňuje zariadenia používať dokonca aj začiatočník, ktorý nemá znalosti technológie. Implementácia spracovania prirodzeného jazyka však nie je ľahká, pretože jazyk, ktorým hovoria ľudia, nemá žiadnu jednoznačnú štruktúru. Je nejednoznačné a závisí od kontextových slov, ktoré môžu mať odlišný význam.
  • NLTK má viac ako 50 korpusových a lexikálnych zdrojov, ako sú WordNet, Problem Report Corpus, Penn Treebank Corpus, atď. Dodáva sa aj so sprievodcom, ktorý vysvetľuje koncepty spracovania jazykov pomocou nástrojov a programovacích základov jazyka Python, čo ľuďom uľahčuje prácu. ktorí nemajú hlboké znalosti programovania. Má širokú škálu balíkov, vďaka ktorým je jedným z výkonných nástrojov pre NLP. Tokenization, Lemmatization, Stemming, Parsing, Počet znakov, Interpunkcia, Počet slov sú niektoré z týchto balíkov.

Nainštalujte NLTK pre Windows

Nižšie sú uvedené pokyny na inštaláciu NLTK vo Windows. Sú založené na predpoklade, že Python nie je nainštalovaný v systéme. NLTK vyžaduje Python verzie 2.7.3.5 a vyššie.

Krok 1: Stiahnite si najnovšiu verziu programu Python pre Windows z odkazu nižšie

https://www.python.org/downloads/

Krok 2: Kliknutím na stiahnutý .exe ho spustíte.

Krok 3: Vyberte možnosť Prispôsobiť inštaláciu.

Krok 4: Skontrolujte všetky funkcie, najmä „pip“, pretože pomáha nainštalovať NLTK a kliknite na Ďalej.

Krok 5: Na ďalšej obrazovke vyberte rozšírené možnosti, vyberte cestu a kliknite na inštaláciu.

Krok 6: Po úspešnej inštalácii v blízkosti okna.

Krok 7: Skopírujte cestu k priečinku Scripts a nainštalujte NLTK do rovnakého priečinka.

NLTK sa dá ľahko nainštalovať pomocou inštalačného programu „pip“. Tiež musíme nainštalovať „numpy“.

Krok 8: Ak chcete nainštalovať NLTK, otvorte príkazový riadok a zadajte príkaz pod príkaz.

Uistite sa, že inštalácia bola úspešná.

Po úspešnej inštalácii je teraz čas použiť NLTK na spracovanie prirodzeného jazyka.

Krok 9: Otvorte Python Shell a napíšte príkaz pod.

Ak je importovaný bez chyby, znamená to, že NLTK je správne nainštalovaný.

Nainštalujte NLTK pre Mac / Linux

Na rozdiel od systému Windows, systémy Linux prichádzajú s nainštalovaným programom Python. Na inštaláciu NLTK v Linuxe / Mac sa používa inštalátor balíka Python Pip. Pre inštaláciu alebo aktualizáciu pip napíšte do príkazového riadka pod príkazy.

Na inštaláciu pythonu v Linuxe použite nasledujúce príkazy.

Krok 1: Na aktualizáciu indexu balíkov použite príkaz uvedený nižšie.

Krok 2: Na inštaláciu Pythonu v systéme Linux použite nižšie.

Krok 3: Zadajte príkaz nižšie a nainštalujte „pip“ pre Python 3.

Krok 4: Po nainštalovaní „Pip“ úspešne nainštalujte NLTK pomocou nasledujúcich príkazov.

Súbor údajov NLTK

NLTK má k dispozícii mnoho súborov údajov na spracovanie prirodzeného jazyka, napríklad WordNet, WikiCorpus, Gutenberg, Lexikón názorov, Tweebank atď. Tieto súbory údajov sa nazývajú korpusy. Súbor údajov NLTK v podstate obsahuje súbor súborov alebo dokumentov. Každý súbor / dokument obsahuje súbor slov, písmen alebo textu v jednom jazyku. Korpus je teda hlavne knižnica na porozumenie / učenie sa jazyka. Má pravidlá gramatiky a štruktúry jazyka.

Po úspešnej inštalácii NLTK ho môžete importovať a pomocou nasledujúceho príkazu tiež stiahnuť jeho korpusy.

Aplikácia NLTK downloader otvorí okno na stiahnutie množín údajov. Veľkosť súboru údajov je veľká, preto to bude nejaký čas trvať. Ak chcete otestovať, či sú súbory údajov správne nainštalované, skúste importovať súbor údajov a použiť ho.

Spracovanie NLTK

Existuje 5 hlavných procesov spracovania prirodzeného jazyka. Toto sú kroky, ktoré sa podieľajú na spracovaní akéhokoľvek textu.

  1. Detekcia EOS : Detekcia konca reči rozdeľuje text na zbierku zmysluplných viet. Rozdeľuje dlhý text na časti, ktoré majú určitý význam.
  2. Tokenization : Tento krok rozdelí vety na žetóny. Žetóny neobsahujú iba slová, ale zahŕňajú aj medzery, zlomy.
  3. Značenie POS : POS znamená pat-of-speech. Tu sú informácie priradené k tokenu. Tieto informácie naznačujú, aký typ prejavu je napätý, slovesný, prídavné meno, podstatné meno atď.
  4. Chunking : Chunking znamená zhromažďovanie textu na základe značiek.
  5. Extrakcia: Extrakcia je prebiehajúci proces prechádzania kúskami a ich označovania ako pomenované entity, ako sú ľudia, miesta, organizácie atď.

záver:

NLTK sa používa na klasifikáciu textu, titulky obrázkov, rozpoznávanie reči, odpovedanie na otázky, jazykové modelovanie, sumarizáciu dokumentov a mnoho ďalších operácií. Existuje mnoho ďalších nástrojov na spracovanie prirodzeného jazyka. NLTK má však širokú škálu knižníc, vďaka ktorým je jedným z výkonných nástrojov na spracovanie prirodzeného jazyka. Je presnejší ako akýkoľvek iný nástroj, ale kvôli veľkému počtu knižníc je trochu pomalý. To všetko závisí od požiadaviek používateľa. Ak chce užívateľ rýchlosť, môže uprednostniť aj iné nástroje, ale potom bude musieť robiť kompromisy s presnosťou obsahu. Ak je však presnosť prioritou, mali by rozhodne ísť za NLTK.

Odporúčané články:

Toto bol návod na inštaláciu NLTK. Tu diskutujeme základný koncept a rôzne kroky na inštaláciu NLTK na Windows a Linux \ Mac. Viac informácií nájdete aj v nasledujúcich článkoch

  1. Nainštalujte informačný panel Kubernetes
  2. Ako nainštalovať JDK
  3. Nainštalujte Docker
  4. Ako nainštalovať Magento?
  5. Verzie Magento | Funkcie verzie Magento