Rozdiely medzi učením pod dohľadom a hlbokým učením

Pri výučbe pod dohľadom obsahujú školiace údaje, ktoré pridávate do algoritmu, požadované riešenia nazývané štítky. Typickou úlohou pod dohľadom je klasifikácia. Dobrým príkladom je filter nevyžiadanej pošty: je vycvičený s mnohými príkladmi e-mailov spolu so svojou triedou (spam alebo šunka) a musí sa naučiť klasifikovať nové e-maily.

Hlboké učenie je pokus napodobniť aktivitu vo vrstvách neurónov v neokortexe, čo je asi 80% mozgu, kde dochádza k mysleniu (V ľudskom mozgu je okolo 100 miliárd neurónov a 100 až 1000 biliónov synapsií). Hovorí sa tomu, že je hlboký, pretože má viac ako jednu skrytú vrstvu neurónov, ktoré pomáhajú pri viacerých stavoch nelineárnej transformácie funkcií

Porovnanie vzájomného porovnávania supervidovaného učenia s hlbokým učením (infografika)

Nižšie je päť najlepších porovnaní medzi supervízovaným vzdelávaním a hlbokým vzdelávaním

Kľúčové rozdiely medzi učením pod dohľadom a hlbokým učením

Obe supervízované vzdelávanie verzus hlboké vzdelávanie sú populárnymi voľbami na trhu; diskutujme o niektorých hlavných rozdieloch medzi učením pod dohľadom a hlbokým učením:

● Hlavné modely -

Dôležité kontrolované modely sú -

k-Nearest Neighbors - Používa sa na klasifikáciu a regresiu
Lineárna regresia - na predikciu / regresiu
Logistická regresia - na klasifikáciu
Support Vector Machines (SVM) - používa sa na klasifikáciu a regresiu
Rozhodovacie stromy a náhodné lesy - úlohy klasifikácie aj regresie

Najobľúbenejšie neurónové siete Deep:

Viacvrstvové perceptróny (MLP) - najzákladnejší typ. Táto sieť je vo všeobecnosti začiatočnou fázou budovania ďalších sofistikovanejších hlbokých sietí a môže sa použiť na akékoľvek kontrolované problémy s regresiou alebo klasifikáciou.

Autoencoders (AE) - Sieť má nepodporované učebné algoritmy pre učenie funkcií, zmenšovanie rozmerov a detekciu odľahlých hodnôt

Konvolučná neurónová sieť (CNN) - zvlášť vhodná pre priestorové údaje, rozpoznávanie objektov a analýzu obrazu pomocou viacrozmerných neurónových štruktúr. Jedným z hlavných dôvodov popularity hlbokého učenia v poslednom čase je CNN.

Rekurentná neurónová sieť (RNN) - RNN sa používajú na sekvenčnú analýzu údajov, ako sú časové rady, analýza sentimentu, NLP, preklad jazyka, rozpoznávanie reči, titulky obrázkov. Jedným z najbežnejších typov modelu RNN je sieť s dlhou krátkodobou pamäťou (LSTM).

Údaje o školeniach - Ako už bolo uvedené, modely pod dohľadom potrebujú údaje o školeniach so štítkami. Hlboké vzdelávanie však dokáže spracovať údaje s menovkami alebo bez nich. Niektoré architektúry neurónových sietí môžu byť bez dozoru, ako napríklad autoenkodéry a stroje Boltzmann obmedzené

Výber prvkov - Niektoré modely pod dohľadom sú schopné analyzovať vlastnosti a vybratú podmnožinu prvkov na určenie cieľa. Väčšinou sa to však musí vyriešiť vo fáze prípravy údajov. V sieťach Deep Neural Networks sa však objavujú nové funkcie a nežiaduce funkcie sa vyraďujú ako pokrok v učení.

Reprezentácia údajov - V klasických dohliadaných modeloch sa nevytvára abstrakcia vstupných prvkov na vysokej úrovni. Konečný model sa snaží predpovedať výstup pomocou matematických transformácií na podmnožinu vstupných funkcií.
V hlbokých neurónových sieťach sa interne vytvárajú abstrakcie vstupných prvkov. Napríklad pri preklade textu neurónová sieť najskôr prevádza vstupný text na interné kódovanie a potom transformuje túto abstrakčnú reprezentáciu na cieľový jazyk.

Framework - Modely ML s podporou systému sú podporované mnohými všeobecnými rámcami ML v rôznych jazykoch - niektoré z nich sú Apache Mahout, Scikit Learn, Spark ML.
Majoritné výučbové rámce poskytujú vývojárom ústretovú abstrakciu na jednoduché vytvorenie siete, postarajú sa o distribúciu výpočtov a majú podporu pre GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow sú veľmi obľúbené rámce. teraz s aktívnou podporou komunity.

Tabuľka porovnania porovnávania s učením verzus Deep Learning

Ďalej uvádzame niektoré kľúčové porovnania medzi supervízovaným učením a hlbokým učením

Základ porovnania medzi supervizovaným učením a hlbokým učením Učenie pod dohľadom Hlboké učenie
Modelový tréningHlavné úlohy v oblasti odbornej prípravy -

  • Iterujte cez školiace príklady, väčšinou ako mini šarže, a aktualizujte váhy použité pre funkcie.
  • Smer aktualizácie hmotnosti (prírastok alebo úbytok) určený niektorými ukazovateľmi, ako je gradient chybovej funkcie wrt.
  • Nakoniec je cieľ formulovaný ako transformácia na váženom súčte prvkov podmnožiny.
Hlavné úlohy v oblasti odbornej prípravy -

  • Počet váh, ktoré sa majú aktualizovať, je veľmi veľký, ak je viac skrytých vrstiev.
  • Chyba v cieľovej hodnote vypočítaná ako prvá a prenesená späť do každej vrstvy
  • Nájdite čiastočný derivát váhovej funkcie wrt a aktualizujte hmotnosti, aby ste znížili chybu.
Potenciál systémuPoužíva sa na riešenie relatívne jednoduchých úloh, pri ktorých je vzťah k vstupným prvkom a cieľu detekovateľný človekom a priamy vývoj prvkov. Napr .:

  • Binomická alebo viacstupňová klasifikácia, ako napríklad klasifikácia zákazníkov na základe ich interakcie s webovou stránkou.
  • Predpovedajte hodnotu nehnuteľností pomocou podobných zhromaždených údajov.
Hlboké vzdelávanie môže robiť naozaj inteligentné úlohy, ako je napríklad

  • Klasifikácia obrazu takmer na ľudskej úrovni
  • Rozpoznávanie reči takmer na ľudskej úrovni
  • Prepis rukopisu takmer na ľudskej úrovni
  • Vylepšený strojový preklad
  • Digitálni asistenti ako Asistent Google a Amazon Alexa
flexibilitaModely sú flexibilnejšie, čo pomáha ľahko doladiť model ML. Existujú dobre definované metódy, ako napríklad mriežkové vyhľadávanie s krížovou validáciou, aby sa našli správne hyperparametreMenej flexibilné, pretože existuje veľa hyperparametrov, ktoré sa môžu vyladiť, ako je počet vrstiev, počet neurónov na vrstvu, typ aktivačnej funkcie, ktorá sa má použiť v každej vrstve, logika inicializácie hmotnosti a oveľa viac.
Zastúpenie funkcieOdvodené alebo abstraktné prvky, ktoré sa majú vytvoriť explicitne. Napríklad polynomické vlastnosti ako vstup pre model lineárnej regresieAbstraktné zobrazenie údajov automaticky generované v skrytých vrstvách. Preto môže vyškolená nervová sieť CNN detekovať mačku v obraze.
Generatívne modelyNie je možné vygenerovať nič originálne, pretože nedochádza k automatickému zobrazovaniu abstraktných údajovPo zaškolení môže špecifický typ hlbokej neurónovej siete generovať nové obrázky, piesne alebo texty. Nazývajú sa GNN (Generative neuron network) alebo GAN (Generative Adversarial Networks)

Určitá implementácia tohto typu siete sa používa na vytvorenie dokonca nových módnych návrhov

Záver - Dozorované učenie vs hlboké učenie

Presnosť a schopnosť DNN (Deep Neural Networks) sa v posledných rokoch značne zvýšila. Preto sú DNN teraz oblasťou aktívneho výskumu a veríme, že má potenciál vyvinúť všeobecný inteligentný systém. Zároveň je ťažké zdôvodniť, prečo DNN poskytuje konkrétny výstup, ktorý dolaďovanie siete naozaj sťažuje. Ak sa dá problém vyriešiť pomocou jednoduchých modelov ML, dôrazne sa odporúča použiť ho. Z tohto dôvodu bude mať jednoduchá lineárna regresia význam, aj keď sa vyvinie všeobecný inteligentný systém pomocou DNN.

Odporúčaný článok

Bol to sprievodca po hlavných rozdieloch medzi supervízovaným vzdelávaním a hlbokým vzdelávaním. Tu diskutujeme aj kľúčové rozdiely medzi supervízovaným učením a hlbokým učením s informačnými a porovnávacími tabuľkami. Môžete sa tiež pozrieť na nasledujúce články -

  1. Dozorované učenie vs učenie posilnenia
  2. Učenie pod dohľadom vs učenie bez dozoru
  3. Neurónové siete vs hlboké učenie
  4. Strojové učenie vs prediktívne analýzy
  5. TensorFlow vs Caffe: Aké sú rozdiely
  6. Čo je učenie pod dohľadom?
  7. Čo je výučba posilnenia?
  8. Top 6 Porovnanie medzi CNN vs RNN

Kategórie: