Úvod do klasifikácie neurónovej siete

Neurónové siete sú najúčinnejším spôsobom (áno, čítate to správne) na riešenie problémov v reálnom svete v oblasti umelej inteligencie. V súčasnosti je tiež jednou z rozsiahle skúmaných oblastí počítačovej vedy, že pri čítaní tohto článku by sa vyvinula nová forma neurónovej siete. Existujú stovky neurónových sietí na riešenie problémov špecifických pre rôzne domény. Tu vás prevedieme rôznymi typmi základných neurónových sietí v poradí zvyšujúcej sa zložitosti.

Rôzne typy základov pri klasifikácii neurónových sietí

1. Plytké neurónové siete (kolaboratívne filtrovanie)

Neurónové siete sú tvorené skupinami Perceptronu na simuláciu nervovej štruktúry ľudského mozgu. Plytké neurónové siete majú jednu skrytú vrstvu perceptrónu. Jedným z bežných príkladov plytkých neurónových sietí je kolaboratívne filtrovanie. Skrytá vrstva perceptrónu by bola trénovaná tak, aby reprezentovala podobnosti medzi entitami, aby generovala odporúčania. Systém odporúčaní v sieťach Netflix, Amazon, YouTube atď. Používa na odporúčanie svojich produktov verziu záujmu na základe svojich záujmov.

2. Viacvrstvový perceptrón (hlboké neurónové siete)

Neurónové siete s viac ako jednou skrytou vrstvou sa nazývajú hlboké neurónové siete. Upozornenie na spojler! Všetky nasledujúce neurónové siete sú formou hlbokej neurónovej siete vylepšenej / vylepšenej na riešenie problémov špecifických pre danú doménu. Všeobecne nám pomáhajú dosiahnuť univerzálnosť. Vzhľadom na dostatočný počet skrytých vrstiev neurónu sa hlboká neurónová sieť môže priblížiť, tj vyriešiť akýkoľvek zložitý problém v skutočnom svete.

Univerzálna aproximačná veta je jadrom hlbokých neurónových sietí na trénovanie a prispôsobenie každého modelu. Každá verzia hlbokej neurónovej siete je vyvinutá pomocou plne prepojenej vrstvy maximálneho združeného produktu násobenia matíc, ktorý je optimalizovaný algoritmami spätného šírenia. Budeme sa naďalej učiť zlepšeniam, ktoré vyústia do rôznych foriem hlbokých neurónových sietí.

3. Konvolučná neurónová sieť (CNN)

CNN sú najvyspelejšou formou hlbokých neurónových sietí, ktoré vytvárajú najpresnejšie, tj lepšie výsledky v počítačovom videní ako ľudské výsledky. CNN sú vyrobené z vrstiev Konvolúcií vytvorených skenovaním každého pixelu obrázkov v množine údajov. Keď dáta získajú aproximovanú vrstvu po vrstve, CNN začne rozpoznávať vzory a tým rozoznávať objekty v obrazoch. Tieto objekty sa vo veľkej miere používajú v rôznych aplikáciách na identifikáciu, klasifikáciu atď. Nedávne postupy, ako je učenie prenosu v CNN, viedli k významnému zlepšeniu nepresnosti modelov. Google Translator a Google Lens sú najmodernejším príkladom CNN.

Aplikácia CNN je exponenciálna, pretože sa dokonca používajú pri riešení problémov, ktoré sa primárne netýkajú počítačového videnia. Tu nájdete veľmi jednoduché, ale intuitívne vysvetlenie CNN.

4. Opakujúca sa neurónová sieť (RNN)

RNN sú najnovšou formou hlbokých neurónových sietí na riešenie problémov v NLP. Jednoducho povedané, RNN privádzajú výstup niekoľkých skrytých vrstiev späť do vstupnej vrstvy, aby sa agregovali a preniesli priblíženie k ďalšej iterácii (epoche) vstupného súboru údajov. Pomáha tiež modelu naučiť sa a do istej miery korigovať predpovede. Takéto modely sú veľmi užitočné pri porozumení sémantiky textu pri operáciách NLP. Existujú rôzne varianty RNN, ako je dlhá krátkodobá pamäť (LSTM), hradlová rekurentná jednotka (GRU), atď. Na nasledujúcom diagrame je aktivácia z hl a h2 napájaná vstupom x2 a x3.

5. Dlhodobá krátkodobá pamäť (LSTM)

LSTM sú navrhnuté špeciálne na riešenie problému úbytku gradientov s RNN. Miznúce prechody sa vyskytujú pri veľkých neurónových sieťach, kde sa gradienty stratových funkcií majú tendenciu priblížiť sa k nule, čo vedie k pozastaveniu nervových sietí, aby sa učili. LSTM rieši tento problém tým, že bráni aktivačným funkciám v rámci svojich opakujúcich sa komponentov a tým, že uložené hodnoty nezmutuje. Táto malá zmena priniesla veľké vylepšenia v konečnom modeli, čo viedlo k tomu, že technici prispôsobili LSTM vo svojich riešeniach. Až po „najjednoduchšie samovysvetľujúce“ ilustrácie LSTM,

6. Siete založené na pozornosti

Modely pozornosti v praxi pomaly preberajú aj nové RNN. Modely Attention sú vytvorené zameraním sa na časť podmnožiny informácií, ktoré sú dané, čím sa eliminuje obrovské množstvo základných informácií, ktoré nie sú potrebné pre danú úlohu. Modely pozornosti sú vyrobené z kombinácie mäkkej a tvrdej pozornosti a prispôsobenia pomocou šírenia mäkkej pozornosti dozadu. Hierarchicky usporiadané viaceré modely pozornosti sa nazývajú transformátor. Tieto transformátory sú efektívnejšie na to, aby mohli komíny bežať paralelne tak, aby priniesli najmodernejšie výsledky s porovnateľne menšími údajmi a časom na zaškolenie modelu. Pri použití s ​​CNN / RNN sa distribúcia pozornosti stáva veľmi silnou a môže takto vytvoriť textový popis obrázku.

Tech giganti ako Google, Facebook, atď. Rýchlo prispôsobujú modely pozornosti na vytváranie svojich riešení.

7. Generatívna kontradiktórna sieť (GAN)

Hoci modely hlbokého učenia poskytujú najmodernejšie výsledky, môžu ich oklamať omnoho inteligentnejšie ľudské náprotivky pridaním šumu k údajom v reálnom svete. GAN sú najnovším vývojom v oblasti hlbokého učenia sa pri riešení takýchto scenárov. GAN používajú vzdelávanie bez dozoru, keď hlboké neurónové siete trénované s údajmi generovanými AI modelom spolu so skutočným súborom údajov na zlepšenie presnosti a efektívnosti modelu. Tieto kontradiktórne údaje sa väčšinou používajú na oklamanie diskriminačného modelu s cieľom vytvoriť optimálny model. Výsledný model má tendenciu byť lepšou aproximáciou, ako dokáže tento šum prekonať. Záujem o výskum v oblasti GAN viedol k sofistikovanejším implementáciám, ako sú podmienené GAN (CGAN), Laplacian Pyramid GAN (LAPGAN), GAN s vysokým rozlíšením (SRGAN) atď.

Záver - Klasifikácia neurónovej siete

Hlboké neurónové siete posúvajú hranice počítačov. Nie sú obmedzené iba na klasifikáciu (CNN, RNN) alebo predpovede (kolaboratívne filtrovanie), ale aj na generovanie údajov (GAN). Tieto údaje sa môžu líšiť od krásnej formy umenia po kontroverzné Hlboké falzifikáty, napriek tomu každý deň predbiehajú človeka. Preto by sme mali brať ohľad aj na etiku a dopady AI a usilovne pracovať na vybudovaní účinného modelu neurónovej siete. Čas na elegantný infographic o nervových sieťach.

Odporúčané články

Toto je sprievodca klasifikáciou neurónovej siete. Tu sme diskutovali o rôznych typoch základných neurónových sietí. Ak sa chcete dozvedieť viac, môžete si tiež prečítať naše dané články.

  1. Čo sú neurónové siete?
  2. Algoritmy neurónovej siete
  3. Nástroje sieťového skenovania
  4. Opakujúce sa neurónové siete (RNN)
  5. Top 6 Porovnanie medzi CNN vs RNN

Kategórie: