Čo je učenie pod dohľadom? - Ako to funguje Typy a výhody

Úvod do učenia pod dohľadom

Dohliadané učenie je oblasť strojového učenia, kde pracujeme na predpovedaní hodnôt pomocou označených súborov údajov. Označené vstupné dátové súbory sa nazývajú nezávislá premenná, zatiaľ čo predpovedané výsledky sa nazývajú závislá premenná, pretože ich výsledky závisia od nezávislej premennej. Napríklad my všetci máme v našom e-mailovom účte (napríklad Gmail) priečinok so spamom, ktorý automaticky detekuje väčšinu e-mailov s nevyžiadanou poštou alebo podvodom s presnosťou vyššou ako 95%. Funguje to na základe dohliadaného vzdelávacieho modelu, kde máme školiacu sadu označených údajov, čo je v tomto prípade označený spamový e-mail označený používateľmi. Tieto školiace súpravy sa používajú na učenie, ktoré sa neskôr použije na kategorizáciu nových e-mailov ako spam, ak sa hodia do danej kategórie.

Práca na strojovom učení pod dohľadom

Pochopme príklad strojového učenia pod dohľadom. Povedzme, že máme košík s ovocím, ktorý je plný rôznych druhov ovocia. Našou úlohou je kategorizovať ovocie podľa ich kategórie.

V našom prípade sme zvážili štyri druhy ovocia, a to jablko, banán, hrozno a pomaranče.

Teraz sa pokúsime spomenúť niektoré jedinečné vlastnosti týchto plodov, vďaka ktorým sú jedinečné.

S č.	veľkosť	farba	tvar	Krstné meno
1	malý	zelená	Okrúhly až oválny, Zväzok tvaru valca	zrnko vína
2	veľký	červená	Zaoblený tvar so zahĺbením v hornej časti	jablko
3	veľký	žltá	Valec s dlhým zakrivením	banán
4	veľký	oranžový	Zaoblený tvar	oranžový

Teraz povedzme, že ste si vybrali ovocie z ovocného koša, pozreli ste sa napríklad na jeho vlastnosti, napríklad jeho tvar, veľkosť a farbu, a potom odvodzujete, že farba tohto ovocia je červená, veľkosť, ak je veľká, tvar je zaoblený tvar so zahĺbením v hornej časti, preto je to jablko.

Rovnako urobíte to isté pre všetky ostatné zvyšky ovocia.
Stĺpec úplne vpravo („Názov ovocia“) sa nazýva premenná odpovede.
Takto sformulujeme supervizovaný vzdelávací model, teraz bude pre každého nového (povedzme robot alebo cudzinec) s ľahkosťami jednoduché ľahšie zoskupiť rovnaký druh ovocia.

Typy dohliadaného algoritmu strojového učenia

Pozrime sa na rôzne typy algoritmov strojového učenia:

regresia:

Regresia sa používa na predpovedanie výstupu jednej hodnoty pomocou súboru údajov o tréningu. Výstupná hodnota sa vždy nazýva závislá premenná, zatiaľ čo vstupy sa nazývajú nezávislá premenná. Máme rôzne typy regresie v supervízovanom vzdelávaní, napríklad,

Lineárna regresia - tu máme iba jednu nezávislú premennú, ktorá sa používa na predpovedanie výstupu, tj závislej premennej.
Viacnásobná regresia - tu máme viac ako jednu nezávislú premennú, ktorá sa používa na predpovedanie výstupu, tj závislej premennej.
Polynomická regresia - Graf medzi závislými a nezávislými premennými sleduje polynomickú funkciu. Napríklad najprv sa s vekom pamäť zvyšuje, potom v určitom veku dosiahne hranicu a potom, keď starneme, začne klesať.

Klasifikácia:

Klasifikácia dohliadaných učebných algoritmov sa používa na zoskupenie podobných objektov do jedinečných tried.

Binárna klasifikácia - Ak sa algoritmus pokúša zoskupiť 2 odlišné skupiny tried, nazýva sa binárna klasifikácia.
Klasifikácia viacerých tried - Ak sa algoritmus pokúša zoskupiť objekty do viac ako 2 skupín, nazýva sa klasifikácia viacerých tried.
Algoritmy pevnosti - klasifikácia zvyčajne fungujú veľmi dobre.
Nevýhody - náchylné na nadmerné vybavenie a môžu byť neobmedzené. Napríklad - klasifikátor spamových e - mailov
Logistická regresia / klasifikácia - Ak je premenná Y binárna kategorická kategória (tj 0 alebo 1), použijeme pre predikciu logistickú regresiu. Napríklad - Predpovedanie, či je daná transakcia kreditnou kartou podvod alebo nie.
Naivné Bayesovské klasifikátory - Naivský Bayesov klasifikátor je založený na Bayesovskej vete. Tento algoritmus sa zvyčajne najlepšie hodí, keď je veľkosť vstupov vysoká. Pozostáva z acyklických grafov, ktoré majú jedného rodiča a mnoho detských uzlov. Podriadené uzly sú navzájom nezávislé.
Rozhodovacie stromy - Rozhodovací strom je stromová štruktúra podobná štruktúre, ktorá pozostáva z interného uzla (test na atribúte), vetvy, ktorá označuje výsledok testu, a listových uzlov, ktoré predstavujú rozdelenie tried. Koreňový uzol je najvyšším uzlom. Je to veľmi široko používaná technika, ktorá sa používa na klasifikáciu.
Podporný vektorový stroj - Podporný vektorový stroj je alebo SVM vykonáva klasifikáciu nájdením hyperplánu, ktorý by mal maximalizovať rozpätie medzi 2 triedami. Tieto stroje SVM sú spojené s funkciami jadra. Polia, v ktorých sa SVM vo veľkej miere používajú, sú biometria, rozpoznávanie vzorov atď.

výhody

Nižšie sú uvedené niektoré z výhod modelov strojového učenia pod dohľadom:

Výkonnosť modelov môže byť optimalizovaná na základe používateľských skúseností.
Dozorované učenie produkuje výstupy s využitím predchádzajúcich skúseností a tiež vám umožňuje zhromažďovať údaje.
Algoritmy pod dohľadom strojového učenia sa môžu použiť na implementáciu mnohých problémov v reálnom svete.

nevýhody

Nevýhody učenia pod dohľadom sú nasledujúce:

Úsilie školenia modelov strojového učenia pod dohľadom môže trvať veľa času, ak je súbor údajov väčší.
Klasifikácia veľkých údajov niekedy predstavuje väčšiu výzvu.
Možno sa bude musieť zaoberať problémami nadmerného vybavenia.
Potrebujeme veľa dobrých príkladov, ak chceme, aby model fungoval dobre, zatiaľ čo trénujeme klasifikátor.

Osvedčené postupy pri budovaní vzdelávacích modelov

Pri zostavovaní modelov učených strojových zariadení s osvedčením je to dobrý postup: -

Pred vytvorením akéhokoľvek dobrého modelu strojového učenia sa musí vykonať proces predbežného spracovania údajov.
Jeden sa musí rozhodnúť o algoritme, ktorý by mal byť pre daný problém najvhodnejší.
Musíme sa rozhodnúť, aký typ údajov sa použije pre školiacu súpravu.
Musí sa rozhodnúť o štruktúre algoritmu a funkcie.

záver

V našom článku sme sa dozvedeli, čo je učenie pod dohľadom, a videli sme, že tu trénujeme model pomocou označených údajov. Potom sme sa rozhodli pracovať na modeloch a ich rôznych typoch. Nakoniec sme videli výhody a nevýhody týchto dohliadaných algoritmov strojového učenia.

Odporúčané články

Toto je sprievodca, čo je vzdelávanie pod dohľadom? Tu diskutujeme pojmy, ako to funguje, typy, výhody a nevýhody supervízovaného učenia. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

Čo je hlboké vzdelávanie
Dozorované učenie vs hlboké učenie
Čo je synchronizácia v jazyku Java?
Čo je to webhosting?
Spôsoby, ako vytvoriť rozhodovací strom s výhodami
Polynomická regresia Použitie a funkcie

Čo je učenie pod dohľadom? - Ako to funguje Typy a výhody

Obsah:

Úvod do učenia pod dohľadom

Práca na strojovom učení pod dohľadom

Typy dohliadaného algoritmu strojového učenia

regresia:

Klasifikácia:

výhody

nevýhody

Osvedčené postupy pri budovaní vzdelávacích modelov

záver

Odporúčané články

Odkryť stĺpce v Exceli Rôzne metódy na odkrytie stĺpcov v Exceli

Universal Analytics vs Google Analytics - dôležité rozdiely

Unixoví operátori Rôzne typy operátorov v Unixe

Povolenia pre súbory Unix Príručka k súborovým povoleniam systému Unix s príkladom

Systém súborov Unix Komplexná príručka o súborovom systéme Unix

PRINCE2 Proces - Naučte sa 7 princípov a tém procesu PRINCE2

Softvér Primavera Funkcie a výhody softvéru Primavera

Prince2 v projektovom riadení Kľúčové vlastnosti a výhody systému Prince2

Princípy Prince2 Naučte sa najlepších 7 princípov Prince2

Počiatočné číslo v C ++ - Nájdite prvotné čísla pomocou rôznych metód

Top 7 najlepších a užitočných násilných kníh Python (kapitola)

Top 10 otázok a odpovedí na rozhovor s virtualizáciou (aktualizované pre rok 2019)

Softvér VFX Top 5 techník na vytvorenie ohromujúcich efektov VFX

Čo je to Virtual Host? - Proces vytvárania virtuálneho hostiteľa krok za krokom

VI Editor v Unixe Režimy editora VI v Unixe a syntaxi