Úvod do architektúry strojového učenia
Architektúra strojového učenia sa ako predmet sa v posledných rokoch vyvinula z konceptu fantázie po dôkaz reality.
Zo základného prístupu k rozpoznávaniu vzorov sa vyvinuli základy pre vývoj hlavnej platformy umelej inteligencie. Základnou myšlienkou bolo zistiť, či sú stroje schopné učiť sa z poskytnutých údajov a či sú schopné produkovať opakovateľné činnosti s vyššou spoľahlivosťou a efektívnym rozhodovaním. Preto môžeme strojové učenie definovať ako odvetvie umelej inteligencie, ktorá trénuje stroje na ako sa učiť. Schopnosť strojového učenia umožňuje systému vykonávať rozhodnutia bez explicitných vstupov od používateľov. Táto schopnosť sa vyvinula do systému založeného na vzorkovom priestore údajov nazývanom tréningové dáta. Využívanie strojového učenia je v súčasnosti viditeľné v každom technologickom pokroku, a to jeho schopnosť mobilných systémov navrhovať voľby v aplikáciách na základe predchádzajúcich vyhľadávaní používateľa, ponuky podľa udalostí na stránkach reštaurácií, prideľovania lôžok podľa veku, V širšom kontexte možno strojové učenie považovať za aplikáciu na prediktívnu analýzu.
Strojové učenie sa môže formálne definovať ako technológia analýzy údajov pre vedomosti, ktoré má systém extrahovať, bez akejkoľvek explicitnej definície, ktorá ich bude vykonávať na základe série pozorovaní.
Typy architektúry strojového učenia
Architektúra strojového učenia sa môže kategorizovať na základe algoritmu použitého v tréningu.
1. Učenie pod dohľadom
V učení pod dohľadom sú použité školiace údaje matematický model, ktorý pozostáva zo vstupov a požadovaných výstupov. Každý zodpovedajúci vstup má priradený výstup, ktorý je známy aj ako kontrolný signál. Prostredníctvom dostupnej výcvikovej matice je systém schopný určiť vzťah medzi vstupom a výstupom a použiť to isté v následných vstupoch po školení, aby sa stanovil zodpovedajúci výstup. Dozorované učenie sa môže ďalej rozšíriť na klasifikáciu a regresnú analýzu na základe výstupných kritérií. Klasifikačná analýza sa predkladá, keď sú výstupy obmedzené svojou povahou a obmedzené na súbor hodnôt. Regresná analýza však definuje numerický rozsah hodnôt pre výstup. Príklady učenia pod dohľadom sú vidieť v systémoch detekcie tváre a overovania rečníkov.
2. Výučba bez dozoru
Na rozdiel od učenia pod dohľadom, učenie bez dozoru využíva školiace údaje, ktoré neobsahujú výstup. Neupozorňované učenie identifikuje vstupné vzťahy na základe trendov, spoločných znakov a výstup sa určuje na základe prítomnosti / neprítomnosti takýchto trendov v používateľskom vstupe.
3. Posilňovací výcvik
Používa sa pri školení systému na rozhodovanie o konkrétnom kontexte relevantnosti pomocou rôznych algoritmov na určenie správneho prístupu v kontexte súčasného stavu. Tieto sa široko používajú pri školení herných portálov, aby zodpovedajúcim spôsobom pracovali na vstupoch od používateľov.
Architektúra procesu strojového učenia
Obr. - Bloková schéma architektúry toku rozhodnutí pre systémy strojového učenia,
Pokúsme sa teraz porozumieť vrstvám znázorneným na obrázku vyššie.
1. Zber údajov
Pretože strojové učenie je založené na dostupných údajoch pre systém, ktorý sa má rozhodnúť, prvým krokom definovaným v architektúre je získavanie údajov. Zahŕňa to zber údajov, prípravu a oddelenie prípadových scenárov na základe určitých prvkov spojených s cyklom rozhodovania a postúpenie údajov spracovacej jednotke na vykonanie ďalšej kategorizácie. Táto fáza sa niekedy nazýva fáza predbežného spracovania údajov. Dátový model očakáva spoľahlivé, rýchle a elastické údaje, ktoré môžu mať diskrétny alebo kontinuálny charakter. Dáta sa potom odovzdajú do systémov na spracovanie toku (pre kontinuálne údaje) a uložia sa v skladoch dávkových údajov (pre diskrétne údaje) pred tým, ako sa prenesú do štádií modelovania alebo spracovania údajov.
2. Spracovanie údajov
Prijaté údaje vo vrstve na získavanie údajov sa potom posielajú do vrstvy na spracovanie údajov, kde sa podrobujú pokročilej integrácii a spracovaniu a zahŕňajú normalizáciu údajov, čistenie, transformáciu a kódovanie údajov. Spracovanie údajov závisí aj od typu použitého učenia. Napríklad, ak sa používa učenie pod dohľadom, je potrebné údaje rozdeliť do viacerých krokov vzoriek údajov potrebných na zaškolenie systému a takto vytvorené údaje sa nazývajú údaje o vzorkách odbornej prípravy alebo jednoducho údaje o výcviku. Spracovanie údajov tiež závisí od druhu požadovaného spracovania a môže zahŕňať voľby od akcie po kontinuálne údaje, ktoré budú zahŕňať použitie architektúry založenej na špecifických funkciách, napríklad architektúra lambda. Môže tiež zahŕňať činnosť na diskrétne údaje, ktoré môžu vyžadujú spracovanie viazané na pamäť. Vrstva na spracovanie údajov definuje, či sa má spracovanie pamäte vykonať pre údaje v tranzite alebo v pokoji.
3. Modelovanie dát
Táto vrstva architektúry zahŕňa výber rôznych algoritmov, ktoré by mohli prispôsobiť systém tak, aby riešil problém, pre ktorý sa učenie navrhuje. Tieto algoritmy sa vyvíjajú alebo zdedili zo súboru knižníc. Algoritmy sa používajú na modelovanie údajov podľa toho, čo robí systém pripraveným na vykonanie.
4. Vykonanie
Táto fáza strojového učenia je miestom, kde sa experimentuje, vykonáva testovanie a vykonáva sa ladenie. Všeobecným cieľom je optimalizovať algoritmus s cieľom extrahovať požadovaný výsledok stroja a maximalizovať výkon systému. Výstupom tohto kroku je rafinované riešenie schopné poskytnúť stroju potrebné údaje, aby mohol robiť rozhodnutia.
5. Nasadenie
Podobne ako akýkoľvek iný softvérový výstup, aj ML výstupy musia byť operatizované alebo odovzdané na ďalšie prieskumné spracovanie. Výstup možno považovať za nedeterministický dotaz, ktorý je potrebné ďalej nasadiť do systému rozhodovania.
Odporúča sa hladko premiestniť výstup ML priamo do výroby, kde to umožní stroju priamo sa rozhodovať na základe výstupu a znížiť závislosť od ďalších prieskumných krokov.
závery
Architektúra strojového učenia teraz zaujíma hlavný priemyselný záujem, pretože každý proces hľadá optimalizáciu dostupných zdrojov a výstupov na základe dostupných historických údajov. Strojové učenie navyše prináša veľké výhody v oblasti predpovedania údajov a prediktívnej analýzy v spojení s technológiou vedeckých údajov. Architektúra strojového učenia definuje rôzne vrstvy zapojené do cyklu strojového učenia a zahŕňa hlavné kroky, ktoré sa vykonávajú pri transformácii nespracovaných údajov na súbory tréningových údajov, ktoré umožňujú rozhodovanie systému.
Odporúčané články
Toto bol sprievodca architektúrou strojového učenia. Tu sme diskutovali o koncepte, procese a typoch architektúry strojového učenia. Ak sa chcete dozvedieť viac, môžete si tiež prečítať naše ďalšie navrhované články -
- Dozorované učenie vs hlboké učenie
- Čo je API v Java?
- Čo je architektúra HBase?
- Čo je to pretečenie vyrovnávacej pamäte?