Rozdiely medzi učením pod dohľadom a hlbokým učením
Pri výučbe pod dohľadom obsahujú školiace údaje, ktoré pridávate do algoritmu, požadované riešenia nazývané štítky. Typickou úlohou pod dohľadom je klasifikácia. Dobrým príkladom je filter nevyžiadanej pošty: je vycvičený s mnohými príkladmi e-mailov spolu so svojou triedou (spam alebo šunka) a musí sa naučiť klasifikovať nové e-maily.
Hlboké učenie je pokus napodobniť aktivitu vo vrstvách neurónov v neokortexe, čo je asi 80% mozgu, kde dochádza k mysleniu (V ľudskom mozgu je okolo 100 miliárd neurónov a 100 až 1000 biliónov synapsií). Hovorí sa tomu, že je hlboký, pretože má viac ako jednu skrytú vrstvu neurónov, ktoré pomáhajú pri viacerých stavoch nelineárnej transformácie funkcií
Porovnanie vzájomného porovnávania supervidovaného učenia s hlbokým učením (infografika)
Nižšie je päť najlepších porovnaní medzi supervízovaným vzdelávaním a hlbokým vzdelávaním
Kľúčové rozdiely medzi učením pod dohľadom a hlbokým učením
Obe supervízované vzdelávanie verzus hlboké vzdelávanie sú populárnymi voľbami na trhu; diskutujme o niektorých hlavných rozdieloch medzi učením pod dohľadom a hlbokým učením:
● Hlavné modely -
Dôležité kontrolované modely sú -
○ k-Nearest Neighbors - Používa sa na klasifikáciu a regresiu
○ Lineárna regresia - na predikciu / regresiu
○ Logistická regresia - na klasifikáciu
○ Support Vector Machines (SVM) - používa sa na klasifikáciu a regresiu
○ Rozhodovacie stromy a náhodné lesy - úlohy klasifikácie aj regresie
Najobľúbenejšie neurónové siete Deep:
● Viacvrstvové perceptróny (MLP) - najzákladnejší typ. Táto sieť je vo všeobecnosti začiatočnou fázou budovania ďalších sofistikovanejších hlbokých sietí a môže sa použiť na akékoľvek kontrolované problémy s regresiou alebo klasifikáciou.
● Autoencoders (AE) - Sieť má nepodporované učebné algoritmy pre učenie funkcií, zmenšovanie rozmerov a detekciu odľahlých hodnôt
● Konvolučná neurónová sieť (CNN) - zvlášť vhodná pre priestorové údaje, rozpoznávanie objektov a analýzu obrazu pomocou viacrozmerných neurónových štruktúr. Jedným z hlavných dôvodov popularity hlbokého učenia v poslednom čase je CNN.
● Rekurentná neurónová sieť (RNN) - RNN sa používajú na sekvenčnú analýzu údajov, ako sú časové rady, analýza sentimentu, NLP, preklad jazyka, rozpoznávanie reči, titulky obrázkov. Jedným z najbežnejších typov modelu RNN je sieť s dlhou krátkodobou pamäťou (LSTM).
● Údaje o školeniach - Ako už bolo uvedené, modely pod dohľadom potrebujú údaje o školeniach so štítkami. Hlboké vzdelávanie však dokáže spracovať údaje s menovkami alebo bez nich. Niektoré architektúry neurónových sietí môžu byť bez dozoru, ako napríklad autoenkodéry a stroje Boltzmann obmedzené
● Výber prvkov - Niektoré modely pod dohľadom sú schopné analyzovať vlastnosti a vybratú podmnožinu prvkov na určenie cieľa. Väčšinou sa to však musí vyriešiť vo fáze prípravy údajov. V sieťach Deep Neural Networks sa však objavujú nové funkcie a nežiaduce funkcie sa vyraďujú ako pokrok v učení.
● Reprezentácia údajov - V klasických dohliadaných modeloch sa nevytvára abstrakcia vstupných prvkov na vysokej úrovni. Konečný model sa snaží predpovedať výstup pomocou matematických transformácií na podmnožinu vstupných funkcií.
V hlbokých neurónových sieťach sa interne vytvárajú abstrakcie vstupných prvkov. Napríklad pri preklade textu neurónová sieť najskôr prevádza vstupný text na interné kódovanie a potom transformuje túto abstrakčnú reprezentáciu na cieľový jazyk.
● Framework - Modely ML s podporou systému sú podporované mnohými všeobecnými rámcami ML v rôznych jazykoch - niektoré z nich sú Apache Mahout, Scikit Learn, Spark ML.
Majoritné výučbové rámce poskytujú vývojárom ústretovú abstrakciu na jednoduché vytvorenie siete, postarajú sa o distribúciu výpočtov a majú podporu pre GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow sú veľmi obľúbené rámce. teraz s aktívnou podporou komunity.
Tabuľka porovnania porovnávania s učením verzus Deep Learning
Ďalej uvádzame niektoré kľúčové porovnania medzi supervízovaným učením a hlbokým učením
Základ porovnania medzi supervizovaným učením a hlbokým učením | Učenie pod dohľadom | Hlboké učenie |
Modelový tréning | Hlavné úlohy v oblasti odbornej prípravy -
| Hlavné úlohy v oblasti odbornej prípravy -
|
Potenciál systému | Používa sa na riešenie relatívne jednoduchých úloh, pri ktorých je vzťah k vstupným prvkom a cieľu detekovateľný človekom a priamy vývoj prvkov. Napr .:
| Hlboké vzdelávanie môže robiť naozaj inteligentné úlohy, ako je napríklad
|
flexibilita | Modely sú flexibilnejšie, čo pomáha ľahko doladiť model ML. Existujú dobre definované metódy, ako napríklad mriežkové vyhľadávanie s krížovou validáciou, aby sa našli správne hyperparametre | Menej flexibilné, pretože existuje veľa hyperparametrov, ktoré sa môžu vyladiť, ako je počet vrstiev, počet neurónov na vrstvu, typ aktivačnej funkcie, ktorá sa má použiť v každej vrstve, logika inicializácie hmotnosti a oveľa viac. |
Zastúpenie funkcie | Odvodené alebo abstraktné prvky, ktoré sa majú vytvoriť explicitne. Napríklad polynomické vlastnosti ako vstup pre model lineárnej regresie | Abstraktné zobrazenie údajov automaticky generované v skrytých vrstvách. Preto môže vyškolená nervová sieť CNN detekovať mačku v obraze. |
Generatívne modely | Nie je možné vygenerovať nič originálne, pretože nedochádza k automatickému zobrazovaniu abstraktných údajov | Po zaškolení môže špecifický typ hlbokej neurónovej siete generovať nové obrázky, piesne alebo texty. Nazývajú sa GNN (Generative neuron network) alebo GAN (Generative Adversarial Networks)
Určitá implementácia tohto typu siete sa používa na vytvorenie dokonca nových módnych návrhov |
Záver - Dozorované učenie vs hlboké učenie
Presnosť a schopnosť DNN (Deep Neural Networks) sa v posledných rokoch značne zvýšila. Preto sú DNN teraz oblasťou aktívneho výskumu a veríme, že má potenciál vyvinúť všeobecný inteligentný systém. Zároveň je ťažké zdôvodniť, prečo DNN poskytuje konkrétny výstup, ktorý dolaďovanie siete naozaj sťažuje. Ak sa dá problém vyriešiť pomocou jednoduchých modelov ML, dôrazne sa odporúča použiť ho. Z tohto dôvodu bude mať jednoduchá lineárna regresia význam, aj keď sa vyvinie všeobecný inteligentný systém pomocou DNN.
Odporúčaný článok
Bol to sprievodca po hlavných rozdieloch medzi supervízovaným vzdelávaním a hlbokým vzdelávaním. Tu diskutujeme aj kľúčové rozdiely medzi supervízovaným učením a hlbokým učením s informačnými a porovnávacími tabuľkami. Môžete sa tiež pozrieť na nasledujúce články -
- Dozorované učenie vs učenie posilnenia
- Učenie pod dohľadom vs učenie bez dozoru
- Neurónové siete vs hlboké učenie
- Strojové učenie vs prediktívne analýzy
- TensorFlow vs Caffe: Aké sú rozdiely
- Čo je učenie pod dohľadom?
- Čo je výučba posilnenia?
- Top 6 Porovnanie medzi CNN vs RNN