Úvod do konvolučných neurónových sietí

Konvolučné neurónové siete, známe tiež ako CNN alebo ConvNet, patria do kategórie umelých neurónových sietí používaných na spracovanie a vizualizáciu obrazov. Umelá inteligencia využíva pri vykonávaní úlohy hlboké učenie. Neurónové siete sú hardvér alebo softvér programovaný ako neuróny v ľudskom mozgu. Tradičná neurónová sieť sníma iba obrázky so zníženým rozlíšením ako vstupy. CNN rieši tento problém usporiadaním svojich neurónov ako frontálneho laloku ľudských mozgov. Predbežné spracovanie na CNN je v porovnaní s inými algoritmami veľmi menšie. Konvolucia, lineárna matematická operácia sa používa na CNN. V jednej zo svojich vrstiev používa konvolúciu namiesto všeobecného množenia matíc.

Vrstvy v konvolučných neurónových sieťach

Nižšie sú uvedené vrstvy konvolučných neurónových sietí:

1. Vstupná vrstva obrázka

Vstupná vrstva poskytuje vstupy (väčšinou obrázky) a vykonáva sa normalizácia. Tu je potrebné uviesť veľkosť vstupu.

2. Konvolučná vrstva

Konvolúcia sa vykonáva v tejto vrstve a obraz je rozdelený na perceptróny (algoritmus), vytvárajú sa miestne polia, ktoré vedú ku kompresii perceptrónov na rysovacie mapy ako maticu s veľkosťou mx n.

3. Vrstva nelinearity

Mapy funkcií sa tu berú ako vstupné a aktivačné mapy sa uvádzajú ako výstup pomocou aktivačnej funkcie. Aktivačná funkcia sa všeobecne implementuje ako sigmoidné alebo hyperbolické tangensové funkcie.

4. Rektifikačná vrstva

Táto vrstva, ktorá je rozhodujúcou súčasťou CNN, robí školenie rýchlejšie, bez zníženia presnosti. Vykonáva operáciu absolútnej hodnoty prvkov na mapách aktivácie.

5. Rektifikované lineárne jednotky (ReLU)

ReLU kombinuje nelineárne a rektifikačné vrstvy na CNN. Toto vykonáva operáciu prahu, pri ktorej sa záporné hodnoty prevádzajú na nulu. ReLU však nemení veľkosť vstupu.

6. Spoločná vrstva

Spoločná vrstva sa nazýva aj vrstva prevzorkovania, pretože je zodpovedná za zníženie veľkosti aktivačných máp. Na vstupný objem sa použije filter a krok rovnakej dĺžky. Táto vrstva ignoruje menej významné údaje, a preto sa rozpoznávanie obrázkov vykonáva v menšej reprezentácii. Táto vrstva znižuje nadmerné vybavenie. Pretože množstvo parametrov sa zníži pomocou združovacej vrstvy, náklady sa tiež znížia. Vstup je rozdelený do obdĺžnikových združovacích oblastí a vypočíta sa buď maximálny alebo priemerný, čo následne vráti maximum alebo priemer. Max Pooling je populárny.

7. Vypúšťacia vrstva

Táto vrstva náhodne nastaví vstupnú vrstvu na nulu s danou pravdepodobnosťou. Po tejto operácii sa vynechá viac výsledkov v rôznych prvkoch. Táto vrstva tiež pomáha znižovať nadmerné vybavenie. To robí sieť zbytočnou. V tejto vrstve nedochádza k žiadnemu učeniu. Táto operácia sa vykonáva iba počas tréningu.

8. Plne pripojená vrstva

Aktivačné mapy, ktoré sú výstupom predchádzajúcich vrstiev, sa v tejto vrstve premenia na rozdelenie pravdepodobnosti tried. Vrstva FC vynásobí vstup váhovou maticou a pridá vektor zaujatosti.

9. Výstupná vrstva

Po vrstve FC nasleduje vrstva softmax a klasifikácia. Na vstup sa použije funkcia softmax. Klasifikačná vrstva vypočíta funkciu krížovej entropie a straty pre problémy klasifikácie.

10. Regresná vrstva

V tejto vrstve sa počíta polovica strednej kvadratickej chyby. Táto vrstva by mala nasledovať po vrstve FC.

Architektúra konvolučnej neurónovej siete

Nasleduje architektúra konvolučných neurónových sietí:

1. LeNet

LeNet bol predstavený pre optické a rozpoznávanie znakov v dokumentoch v roku 1998. Je malý a ideálny pre beh v procesore. LeNet je malý a ľahko pochopiteľný. Toto je postavené na troch hlavných myšlienkach: miestne recepčné polia zdieľali váhy a priestorové podvzorkovanie. Sieť ukazuje najlepšie interné zobrazenie prvotných obrázkov. Má tri konvolučné vrstvy, dve spoločné vrstvy, jednu úplne spojenú vrstvu a jednu výstupnú vrstvu. Po jednej konvolučnej vrstve bezprostredne nasledovala spojovacia vrstva. Všetky vrstvy sú vysvetlené vyššie.

2. AlexNet

AlexNet bol vyvinutý v roku 2012. Táto architektúra popularizovala CNN v počítačovom videní. Má päť konvolučných a tri plne prepojené vrstvy, kde sa aplikuje ReLU po každej vrstve. Využíva výhody oboch vrstiev, pretože konvolučná vrstva má málo parametrov a dlhý výpočet a je to opak pre plne spojenú vrstvu. Prebytok bol veľmi znížený rozšírením a výpadkom údajov. AlexNet bol hlbší, väčšie a konvolučné vrstvy nie sú oddelené združovacou vrstvou v porovnaní s LeNet.

3. ZF Net

ZF Net bol vyvinutý v roku 2013, čo bola upravená verzia AlexNet. Veľkosť strednej konvolučnej vrstvy sa rozšírila a zmenšil sa krok a prvá veľkosť konvolučnej vrstvy. Práve rozpoznal nedostatky AlexNet a vyvinul vynikajúci. Všetky vrstvy sú rovnaké ako AlexNet. ZF Net upravuje parametre vrstvy, ako je veľkosť filtra alebo krok AlexNet, čo umožňuje znížiť chybovosť.

4. ExpediaNet

Táto architektúra bola vyvinutá v roku 2014. Základná koncepcia je počiatočná vrstva. Táto vrstva pokrýva väčšiu plochu, ale zaznamenáva malé informácie o obrázku. Na zlepšenie výkonu sa v sieti googleNet používa deväť počiatočných modulov. Pretože počiatočná vrstva je náchylná na nadmerné prispôsobenie, používa sa tu viac nelinearít a menej parametrov. Maximálna spoločná vrstva sa používa na zreťazenie výstupu predchádzajúcej vrstvy. Táto architektúra má 22 vrstiev a parametre sú 12x menšie. Je to presnejšie ako AlexNet, tiež rýchlejšie. Miera chybovosti je pomerne nižšia. Priemerná spoločná vrstva sa používa na konci namiesto plne pripojenej vrstvy. Výpočet je znížený, hĺbka a šírka sú zväčšené. Mnoho počiatočných modulov je pripojených, aby prešli hlbšie do architektúry. ExpediaNet prekonal všetky ostatné architektúry vyvinuté do roku 2014. Pre túto architektúru je k dispozícii niekoľko následných verzií.

5. Čistá sieť VGG

To bolo zlepšenie oproti ZFNet a následne nad AlexNet. Má 16 vrstiev s 3 × 3 konvolučnými vrstvami, 2 × 2 spoločnými vrstvami a úplne spojené vrstvy. Táto architektúra prijíma najjednoduchšiu sieťovú štruktúru, má však väčšinu parametrov.

6. ResNet

Architektúra zvyškových sietí bola vyvinutá v roku 2015. Využíva dávkovú normalizáciu a vynecháva použitie vrstiev FC. Táto architektúra používa 152 vrstiev a používa preskočené pripojenia. ResNet sa teraz používa vo všetkých algoritmoch hlbokého učenia sa.

záver

Facebook používa CNN na označovanie obrázkov, Amazon na odporúčanie produktov a Google na vyhľadávanie medzi užívateľskými fotografiami. Všetky tieto činnosti sa vykonávajú s väčšou presnosťou a efektívnosťou. Pokrok v hlbokom vzdelávaní dosiahol štádium, v ktorom sa vyvinula CNN, a pomáha mnohými spôsobmi. Ako sa komplikovaná CNN stáva, pomáha pri zvyšovaní účinnosti.

Odporúčaný článok

Toto je sprievodca konvolučnými neurálnymi sieťami. Tu diskutujeme Úvod do konvolučných neurónových sietí a jeho vrstvy spolu s architektúrou. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Klasifikácia neurónovej siete
  2. Strojové učenie vs neurónová sieť
  3. Prehľad algoritmov neurónovej siete
  4. Opakujúce sa neurónové siete (RNN)
  5. Implementácia neurónových sietí
  6. Top 6 Porovnanie medzi CNN vs RNN

Kategórie: