Technika hlbokého učenia Ako vytvoriť hlboké vzdelávacie modely?

Obsah:

Anonim

Úvod do techniky hlbokého učenia

Technika hlbokého učenia je založená na umelých neurálnych sieťach, ktoré pôsobia ako ľudský mozog. Napodobňuje spôsob myslenia a správania ľudského mozgu. V tomto modeli sa systém učí a vykonáva klasifikáciu podľa obrázkov, textu alebo zvuku. Modely Deep Learning sú trénované veľkými značenými a viacvrstvovými údajmi na dosiahnutie vysokej presnosti výsledku ešte viac ako na ľudskej úrovni. Automobil bez vodiča používa túto technológiu na identifikáciu značky pre zastavenie, chodcov atď. V pohybe. Elektronické prístroje, ako sú mobily, reproduktory, televízia, počítače atď., Majú funkciu hlasového ovládania vďaka funkcii Deep Learning. Táto technika je nová a účinná pre spotrebiteľov a organizácie.

Fungovanie hlbokého učenia

Metódy hĺbkového vzdelávania používajú neurónové siete. Často sa preto označujú ako Deep Neural Networks. Hlboké alebo skryté neurónové siete majú viac skrytých vrstiev hlbokých sietí. Hlboké učenie trénuje AI tak, aby predpovedal výstup pomocou určitých vstupov alebo skrytých vrstiev siete. Tieto siete sú trénované veľkými množinami údajov označenými štítkami a učia sa vlastnosti zo samotných údajov. Učenie pod dohľadom aj bez dozoru pracuje na školení údajov a generovaní funkcií.

Vyššie uvedené kruhy sú neuróny, ktoré sú vzájomne prepojené. Existujú 3 typy neurónov:

  • Vstupná vrstva
  • Skrytá vrstva (vrstvy)
  • Výstupná vrstva

Vstupná vrstva získa vstupné dáta a odovzdá vstup do prvej skrytej vrstvy. Matematické výpočty sa vykonávajú na vstupných údajoch. Nakoniec výstupná vrstva poskytuje zistenia.

CNN alebo konvenčné neurónové siete, jedna z najpopulárnejších neurónových sietí, konvolvuje vlastnosti získané zo vstupných údajov a používa 2D konvolučné vrstvy, aby bola vhodná na spracovanie 2D údajov, ako sú obrázky. CNN preto v tomto prípade obmedzuje použitie manuálnej extrakcie funkcií. Priamo z obrázkov vyberie požadované vlastnosti na klasifikáciu. Vďaka tejto automatizačnej funkcii je CNN väčšinou presný a spoľahlivý algoritmus v strojovom vzdelávaní. Každá CNN sa učí rysom obrazov zo skrytej vrstvy a tieto skryté vrstvy zvyšujú zložitosť naučených obrazov.

Dôležitou súčasťou je školiť AI alebo neurónové siete. Za týmto účelom poskytujeme vstupy zo súboru údajov a nakoniec porovnávame výstupy pomocou výstupu zo súboru údajov. Ak nie je AI netrénovaný, výstup môže byť nesprávny.

Aby sme zistili, aký zlý je výstup AI zo skutočného výstupu, potrebujeme funkciu na výpočet. Táto funkcia sa nazýva nákladová funkcia. Ak je nákladová funkcia nula, tak výstup AI aj skutočný výstup sú rovnaké. Aby sme znížili hodnotu nákladovej funkcie, meníme hmotnosti medzi neurónmi. Pre pohodlný prístup sa môže použiť technika nazývaná Gradient Descent. GD redukuje hmotnosť neurónov na minimum po každej iterácii. Tento proces sa vykonáva automaticky.

Technika hlbokého učenia

Algoritmy Deep Learning prechádzajú niekoľkými vrstvami skrytých vrstiev alebo neurónových sietí. Takže sa dôkladne učia o obrázkoch pre presnú predpoveď. Každá vrstva sa učí a deteguje prvky nízkej úrovne, ako sú hrany, a následne sa nová vrstva zlúči s prvkami predchádzajúcej vrstvy, aby sa dosiahlo lepšie zobrazenie. Napríklad stredná vrstva môže detegovať akýkoľvek okraj objektu, zatiaľ čo skrytá vrstva deteguje celý objekt alebo obrázok.

Táto technika je účinná pri veľkých a zložitých údajoch. Ak sú údaje malé alebo neúplné, spoločnosť DL nebude schopná pracovať s novými údajmi.

Existujú nasledujúce siete hlbokého vzdelávania:

  • Nezabezpečená predškolená sieť : Je to základný model s 3 vrstvami: vstupná, skrytá a výstupná vrstva. Sieť je vyškolená na rekonštrukciu vstupu a potom sa skryté vrstvy učia zo vstupov na zhromažďovanie informácií a nakoniec sú funkcie extrahované z obrazu.
  • Konvenčná neurónová sieť : Ako štandardná neurónová sieť má vo vnútri konvolúciu na detekciu hrán a presné rozpoznávanie objektov.
  • Rekurentná neurónová sieť : V tejto technike sa výstup z predchádzajúcej fázy používa ako vstup pre ďalšiu alebo aktuálnu fázu. RNN ukladá informácie do kontextových uzlov, aby sa naučila vstupné údaje a vytvorila výstup. Napríklad na doplnenie vety potrebujeme slová. tj na predpovedanie nasledujúceho slova sú potrebné predchádzajúce slová, ktoré si treba pamätať. RNN v podstate rieši tento typ problému.
  • Rekurzívne neurónové siete : Ide o hierarchický model, ktorého vstupom je stromová štruktúra. Tento druh siete sa vytvára aplikáciou rovnakej sady závaží na zostavenie vstupov.

Deep Learning má mnoho aplikácií vo finančných oblastiach, počítačovom videní, rozpoznávaní zvuku a reči, analýze lekárskych obrazov, technikách navrhovania liekov atď.

Ako vytvoriť hlboké vzdelávacie modely?

Algoritmy Deep Learning sa vytvárajú spojením vrstiev medzi nimi. Prvý krok vyššie je vstupná vrstva nasledovaná skrytou vrstvou (vrstvami) a výstupnou vrstvou. Každá vrstva sa skladá zo vzájomne prepojených neurónov. Sieť spotrebuje veľké množstvo vstupných údajov, aby ich mohla prevádzkovať vo viacerých vrstvách.

Na vytvorenie modelu hlbokého učenia sú potrebné tieto kroky:

  • Pochopenie problému
  • Identifikujte údaje
  • Vyberte algoritmus
  • Vycvičte model
  • Vyskúšajte model

Učenie sa vyskytuje v dvoch fázach

  • Použite nelineárnu transformáciu vstupných údajov a vytvorte štatistický model ako výstup.
  • Model je vylepšený derivátovou metódou.

Tieto dve fázy operácií sa nazývajú iterácia. Neurónové siete opakujú tieto dva kroky, kým sa nevytvorí požadovaný výstup a presnosť.

1. Tréning sietí: Na trénovanie siete údajov zhromažďujeme veľké množstvo údajov a navrhujeme model, ktorý sa naučí funkcie. Proces je však pomalší v prípade veľmi veľkého počtu údajov.

2. Transfer Learning: Transfer Learning v podstate vylepší vopred trénovaný model a potom sa vykoná nová úloha. V tomto procese sa čas výpočtu skracuje.

3. Extrakcia prvkov : Po vyškolení všetkých vrstiev o vlastnostiach objektu sa z neho extrahujú prvky a presnosť výstupu sa predpovedá.

záver

Deep Learning je podmnožinou ML a ML je podmnožinou AI. Všetky tri technológie a modely majú obrovský vplyv na skutočný život. Podnikateľské subjekty, Komerční giganti implementujú modely Deep Learning pre vynikajúce a porovnateľné výsledky pre automatizáciu, ktorá je inšpirovaná ľudským mozgom.

Odporúčané články

Toto je sprievodca technikou hlbokého učenia. Tu diskutujeme o tom, ako vytvoriť modely hlbokého vzdelávania spolu s dvoma fázami prevádzky. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Čo je hlboké vzdelávanie
  2. Kariéra v hlbokom učení
  3. 13 Užitočné otázky a odpovede týkajúce sa rozhovorov o hlbokom učení
  4. Hyperparameter Machine Learning