Úvod do metód strojového učenia

Nasledujúci článok, Strojové učebné metódy, poskytuje prehľad najbežnejšie používaných metód strojového učenia. Strojové učenie je technika, vďaka ktorej počítač dokáže „učiť“ veci sám. Algoritmy adaptívne zlepšujú svoju výkonnosť s rastúcimi údajmi dostupnými pre vzdelávanie. Čím viac údajov, tým presnejší bude náš model.

Ako sa stroje učia?

Existujú rôzne spôsoby, ako to urobiť. Ktorá metóda sa má úplne dodržať, závisí od vyhlásenia problému. V závislosti od súboru údajov a od nášho problému existujú dva rôzne spôsoby, ako ísť hlbšie. Jedným je učenie pod dohľadom a druhým učenie bez dozoru. Nasledujúca tabuľka vysvetľuje ďalšiu klasifikáciu metód strojového učenia. Budeme o nich diskutovať jeden po druhom.

Pozrite sa na nasledujúcu tabuľku!

Poďme pochopiť, čo znamená supervízované učenie.

Učenie pod dohľadom

Ako už názov napovedá, predstavte si učiteľa alebo školiteľa, ktorý vám pomôže učiť sa. To isté platí pre stroje. Stroj trénujeme alebo učíme pomocou údajov, ktoré sú označené.

Niektoré z najchladnejších kontrolovaných vzdelávacích aplikácií sú:

  • Analýza sentimentu (Twitter, Facebook, Netflix, YouTube atď.)
  • Spracovanie prirodzeného jazyka
  • Klasifikácia obrazu
  • Prediktívna analýza
  • Rozpoznávanie vzorov
  • Detekcia spamu
  • Spracovanie reči / sekvencie

Teraz sa učenie pod dohľadom ďalej delí na klasifikáciu a regresiu. Poďme to pochopiť.

klasifikácia

Klasifikácia je proces nájdenia modelu, ktorý pomáha rozdeliť údaje do rôznych kategórií. V tomto procese sú dáta rozdelené do rôznych štítkov podľa niektorých parametrov uvedených vo vstupe a potom sú štítky predpovedané pre dáta. Kategorický znamená, že výstupná premenná je kategória, tj červená alebo čierna, spam alebo nie spam, diabetik alebo nediabetik atď.

Klasifikačné modely zahŕňajú podporný vektorový stroj (SVM), K-najbližší sused (KNN), Naive Bayes atď.

a) Podporný klasifikátor vektorového stroja (SVM)

SVM je metóda výučby pod dohľadom, ktorá sleduje údaje a triedi ich do jednej z dvoch kategórií. Na kategorizáciu údajov používam hyperplán. Lineárny diskriminačný klasifikátor sa pokúša nakresliť priamu čiaru oddeľujúcu dve sady údajov, a tým vytvoriť model klasifikácie. Jednoducho sa pokúša nájsť čiaru alebo krivku (v dvoch dimenziách) alebo rozdeľovač (vo viacerých dimenziách), ktoré oddeľujú triedy od seba.

Poznámka - Pri klasifikácii viacerých tried používa SVM „jeden verzus odpočinok“, čo znamená výpočet rôznych SVM pre každú triedu.

b) K-najbližší susedný klasifikátor (KNN)

  • Ak čítate pozorne, samotný názov naznačuje, čo algoritmus robí. KNN považuje dátové body, ktoré sú bližšie, oveľa podobnejšie z hľadiska vlastností, a preto s väčšou pravdepodobnosťou patria do rovnakej triedy ako sused. Pre každý nový dátový bod sa vypočíta vzdialenosť od všetkých ostatných dátových bodov a trieda sa rozhodne na základe K najbližších susedov. Áno, môže to znieť chromo, ale pre niektoré klasifikácie to funguje ako čokoľvek iné.
  • Dátový bod je klasifikovaný podľa maximálneho počtu hlasov svojich susedov, potom je dátový bod zaradený do triedy najbližšej medzi svojimi susedmi k.
  • V KNN nie je potrebné učiť sa model a všetka práca sa odohráva v čase, keď sa požaduje predpoveď. Preto sa KNN často označuje ako algoritmus lenivého učenia.

c) Naivný Bayesov klasifikátor

  • Naïve Bayes je algoritmus strojového učenia, ktorý sa dôrazne odporúča pri problémoch s klasifikáciou textu. Je založená na Bayesovej teórii pravdepodobnosti. Tieto klasifikátory sa nazývajú naivné, pretože predpokladajú, že premenné funkcií sú na sebe nezávislé. To znamená, že napríklad máme plnú vetu na vstup, potom Naïve Bayes predpokladá, že každé slovo vo vete je nezávislé od ostatných slov. A potom ich podľa toho klasifikujte. Viem, že to vyzerá dosť naivne, ale je to skvelá voľba pre problémy s klasifikáciou textu a je to obľúbená voľba pre klasifikáciu spamových e-mailov.
  • Poskytuje rôzne typy algoritmov Naive Bayes ako BernoulliNB, GaussianNB, MultinomialNB.
  • Považuje všetky prvky za nesúvisiace, takže sa nemôže naučiť vzťah medzi prvkami. Napríklad, povedzme, Varun rád jedí hamburgery, rád jedia hranolky s koksom. Nemá však rád zjedol hamburger a kombináciu hranoliek s koksom. Tu, Naïve Bayes sa nemôže naučiť vzťah medzi dvoma črtami, ale iba sa učí iba dôležitosť jednotlivých čŕt.

Teraz prejdime na druhú stranu našej kontrolovanej metódy učenia, čo je regresia.

regresia

Regresia je proces nájdenia modelu, ktorý pomáha rozlíšiť údaje pomocou kontinuálnych hodnôt. V tomto je usporiadaná povaha predpokladaných údajov. Medzi najpoužívanejšie regresné modely patrí lineárna regresia, náhodný les (rozhodovacie stromy), neurónové siete.

Lineárna regresia

  • Jeden z najjednoduchších prístupov v učení pod dohľadom, ktorý je užitočný pri predikcii kvantitatívnej odpovede.
  • Lineárna regresia zahŕňa nájdenie najvhodnejšej priamky cez body. Najvhodnejšia línia sa nazýva regresná línia. Najvýhodnejšia čiara presne neprechádza všetkými údajovými bodmi, ale namiesto toho sa snaží najlepšie sa k nim priblížiť.
  • Je to široko používaný algoritmus pre nepretržité údaje. Zameriava sa však iba na priemer závislej premennej a obmedzuje sa na lineárny vzťah.
  • Lineárnu regresiu je možné použiť pre časové rady, predpovedanie trendov. Na základe predchádzajúcich údajov môže predpovedať budúci predaj.

Učenie bez dozoru

  • Výučba bez dozoru je založená na prístupe, ktorý možno považovať za neprítomnosť učiteľa, a teda z absolútnych chýb. Je to užitočné, keď je potrebné naučiť sa zoskupovanie alebo zoskupovanie prvkov. Prvky môžu byť zoskupené (zoskupené) podľa ich podobnosti.
  • V učení bez dozoru sú údaje neoznačené, neklasifikované a algoritmy systému na ne pôsobia bez predchádzajúceho školenia. Neupozorované algoritmy učenia môžu vykonávať zložitejšie úlohy ako kontrolované učebné algoritmy.
  • Neupozorňované učenie zahŕňa zhlukovanie, ktoré sa dá urobiť pomocou K znamená zhlukovanie, hierarchické, gaussovské zmesi, skrytý Markovov model.

Učebné aplikácie bez dozoru sú:

  1. Detekcia podobnosti
  2. Automatické označovanie
  3. Segmentácia objektov (napr. Osoba, zviera, filmy)

clustering

  • Klastrovanie je technika bez dozoru, ktorá sa používa na analýzu údajov v mnohých oblastiach. Algoritmus klastrovania sa hodí, keď chceme získať podrobné informácie o našich údajoch.
  • Príkladom zoskupovania v reálnom svete by mohli byť žánrové zoskupenia spoločnosti Netflix, ktoré sú rozdelené pre rôznych cieľových zákazníkov vrátane záujmov, demografie, životného štýlu atď. Teraz môžete premýšľať o tom, aké užitočné je zoskupovanie, keď spoločnosti chcú porozumieť svojej zákazníckej základni a zamerať sa na nový potenciál. zákazníci.

a) K znamená zhlukovanie

  • K znamená klastrovací algoritmus, ktorý sa pokúša rozdeliť dané neznáme údaje do zhlukov. Náhodne vyberie ťažisko klastrov „k“, vypočíta vzdialenosť medzi dátovými bodmi a ťažiskami klastrov a nakoniec priradí dátový bod klastrovej ťažisku, ktorej vzdialenosť je minimálna zo všetkých ťažísk klastrov.
  • V k-znamená, skupiny sú definované najbližším centroidom pre každú skupinu. Tento centroid funguje ako „mozog“ algoritmu, získava údajové body, ktoré sú im najbližšie, a potom ich pridá do zoskupení.

b) Hierarchické zoskupovanie

Hierarchické klastrovanie je takmer podobné ako pri normálnom klastrovaní, pokiaľ nechcete vytvoriť hierarchiu klastrov. Toto sa môže hodiť, keď sa rozhodnete pre počet klastrov. Predpokladajme napríklad, že v online obchode s potravinami vytvárate skupiny rôznych položiek. Na titulnej domovskej stránke chcete niekoľko širokých položiek a po kliknutí na jednu z položiek sa otvoria konkrétne kategórie, konkrétne konkrétnejšie klastre.

Zníženie rozmerov

Zmenšenie rozmerov možno považovať za kompresiu súboru. Znamená to vylúčiť informácie, ktoré nie sú relevantné. Znižuje sa tým zložitosť údajov a snaží sa uchovávať zmysluplné údaje. Napríklad pri kompresii obrazu znížime rozmernosť priestoru, v ktorom obraz zostane, ako je, bez toho, aby sa zničilo príliš veľa významného obsahu v obraze.

PCA pre vizualizáciu dát

Analýza hlavných komponentov (PCA) je metóda redukcie rozmerov, ktorá môže byť užitočná na vizualizáciu vašich údajov. PCA sa používa na kompresiu údajov vyššej dimenzie na údaje nižšej dimenzie, to znamená, že môžeme použiť PCA na redukciu štvorrozmerných údajov na trojrozmerné alebo 2 rozmery, aby sme mohli vizualizovať a lepšie porozumieť údajom.

Odporúčané články

Toto je sprievodca metódami strojového učenia. Tu uvádzame úvod, ako sa stroje učia? klasifikácie strojového učenia a vývojový diagram spolu s podrobným vysvetlením. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Architektúra strojového učenia
  2. Rámce strojového učenia
  3. Nástroje strojového učenia
  4. Techniky strojového učenia
  5. Hyperparameter Machine Learning
  6. Hierarchický klastrovací algoritmus
  7. Hierarchické zoskupovanie Aglomeračné a deliace sa zoskupovanie

Kategórie: