Úvod do učenia pod dohľadom

Dohliadané učenie je oblasť strojového učenia, kde pracujeme na predpovedaní hodnôt pomocou označených súborov údajov. Označené vstupné dátové súbory sa nazývajú nezávislá premenná, zatiaľ čo predpovedané výsledky sa nazývajú závislá premenná, pretože ich výsledky závisia od nezávislej premennej. Napríklad my všetci máme v našom e-mailovom účte (napríklad Gmail) priečinok so spamom, ktorý automaticky detekuje väčšinu e-mailov s nevyžiadanou poštou alebo podvodom s presnosťou vyššou ako 95%. Funguje to na základe dohliadaného vzdelávacieho modelu, kde máme školiacu sadu označených údajov, čo je v tomto prípade označený spamový e-mail označený používateľmi. Tieto školiace súpravy sa používajú na učenie, ktoré sa neskôr použije na kategorizáciu nových e-mailov ako spam, ak sa hodia do danej kategórie.

Práca na strojovom učení pod dohľadom

Pochopme príklad strojového učenia pod dohľadom. Povedzme, že máme košík s ovocím, ktorý je plný rôznych druhov ovocia. Našou úlohou je kategorizovať ovocie podľa ich kategórie.

V našom prípade sme zvážili štyri druhy ovocia, a to jablko, banán, hrozno a pomaranče.

Teraz sa pokúsime spomenúť niektoré jedinečné vlastnosti týchto plodov, vďaka ktorým sú jedinečné.

S č.

veľkosť farba tvar

Krstné meno

1

malý zelená Okrúhly až oválny, Zväzok tvaru valca

zrnko vína

2

veľký červená Zaoblený tvar so zahĺbením v hornej časti

jablko

3

veľký žltá Valec s dlhým zakrivením

banán

4 veľký oranžový Zaoblený tvar

oranžový

Teraz povedzme, že ste si vybrali ovocie z ovocného koša, pozreli ste sa napríklad na jeho vlastnosti, napríklad jeho tvar, veľkosť a farbu, a potom odvodzujete, že farba tohto ovocia je červená, veľkosť, ak je veľká, tvar je zaoblený tvar so zahĺbením v hornej časti, preto je to jablko.

  • Rovnako urobíte to isté pre všetky ostatné zvyšky ovocia.
  • Stĺpec úplne vpravo („Názov ovocia“) sa nazýva premenná odpovede.
  • Takto sformulujeme supervizovaný vzdelávací model, teraz bude pre každého nového (povedzme robot alebo cudzinec) s ľahkosťami jednoduché ľahšie zoskupiť rovnaký druh ovocia.

Typy dohliadaného algoritmu strojového učenia

Pozrime sa na rôzne typy algoritmov strojového učenia:

regresia:

Regresia sa používa na predpovedanie výstupu jednej hodnoty pomocou súboru údajov o tréningu. Výstupná hodnota sa vždy nazýva závislá premenná, zatiaľ čo vstupy sa nazývajú nezávislá premenná. Máme rôzne typy regresie v supervízovanom vzdelávaní, napríklad,

  • Lineárna regresia - tu máme iba jednu nezávislú premennú, ktorá sa používa na predpovedanie výstupu, tj závislej premennej.
  • Viacnásobná regresia - tu máme viac ako jednu nezávislú premennú, ktorá sa používa na predpovedanie výstupu, tj závislej premennej.
  • Polynomická regresia - Graf medzi závislými a nezávislými premennými sleduje polynomickú funkciu. Napríklad najprv sa s vekom pamäť zvyšuje, potom v určitom veku dosiahne hranicu a potom, keď starneme, začne klesať.

Klasifikácia:

Klasifikácia dohliadaných učebných algoritmov sa používa na zoskupenie podobných objektov do jedinečných tried.

  • Binárna klasifikácia - Ak sa algoritmus pokúša zoskupiť 2 odlišné skupiny tried, nazýva sa binárna klasifikácia.
  • Klasifikácia viacerých tried - Ak sa algoritmus pokúša zoskupiť objekty do viac ako 2 skupín, nazýva sa klasifikácia viacerých tried.
  • Algoritmy pevnosti - klasifikácia zvyčajne fungujú veľmi dobre.
  • Nevýhody - náchylné na nadmerné vybavenie a môžu byť neobmedzené. Napríklad - klasifikátor spamových e - mailov
  • Logistická regresia / klasifikácia - Ak je premenná Y binárna kategorická kategória (tj 0 alebo 1), použijeme pre predikciu logistickú regresiu. Napríklad - Predpovedanie, či je daná transakcia kreditnou kartou podvod alebo nie.
  • Naivné Bayesovské klasifikátory - Naivský Bayesov klasifikátor je založený na Bayesovskej vete. Tento algoritmus sa zvyčajne najlepšie hodí, keď je veľkosť vstupov vysoká. Pozostáva z acyklických grafov, ktoré majú jedného rodiča a mnoho detských uzlov. Podriadené uzly sú navzájom nezávislé.
  • Rozhodovacie stromy - Rozhodovací strom je stromová štruktúra podobná štruktúre, ktorá pozostáva z interného uzla (test na atribúte), vetvy, ktorá označuje výsledok testu, a listových uzlov, ktoré predstavujú rozdelenie tried. Koreňový uzol je najvyšším uzlom. Je to veľmi široko používaná technika, ktorá sa používa na klasifikáciu.
  • Podporný vektorový stroj - Podporný vektorový stroj je alebo SVM vykonáva klasifikáciu nájdením hyperplánu, ktorý by mal maximalizovať rozpätie medzi 2 triedami. Tieto stroje SVM sú spojené s funkciami jadra. Polia, v ktorých sa SVM vo veľkej miere používajú, sú biometria, rozpoznávanie vzorov atď.

výhody

Nižšie sú uvedené niektoré z výhod modelov strojového učenia pod dohľadom:

  1. Výkonnosť modelov môže byť optimalizovaná na základe používateľských skúseností.
  2. Dozorované učenie produkuje výstupy s využitím predchádzajúcich skúseností a tiež vám umožňuje zhromažďovať údaje.
  3. Algoritmy pod dohľadom strojového učenia sa môžu použiť na implementáciu mnohých problémov v reálnom svete.

nevýhody

Nevýhody učenia pod dohľadom sú nasledujúce:

  • Úsilie školenia modelov strojového učenia pod dohľadom môže trvať veľa času, ak je súbor údajov väčší.
  • Klasifikácia veľkých údajov niekedy predstavuje väčšiu výzvu.
  • Možno sa bude musieť zaoberať problémami nadmerného vybavenia.
  • Potrebujeme veľa dobrých príkladov, ak chceme, aby model fungoval dobre, zatiaľ čo trénujeme klasifikátor.

Osvedčené postupy pri budovaní vzdelávacích modelov

Pri zostavovaní modelov učených strojových zariadení s osvedčením je to dobrý postup: -

  1. Pred vytvorením akéhokoľvek dobrého modelu strojového učenia sa musí vykonať proces predbežného spracovania údajov.
  2. Jeden sa musí rozhodnúť o algoritme, ktorý by mal byť pre daný problém najvhodnejší.
  3. Musíme sa rozhodnúť, aký typ údajov sa použije pre školiacu súpravu.
  4. Musí sa rozhodnúť o štruktúre algoritmu a funkcie.

záver

V našom článku sme sa dozvedeli, čo je učenie pod dohľadom, a videli sme, že tu trénujeme model pomocou označených údajov. Potom sme sa rozhodli pracovať na modeloch a ich rôznych typoch. Nakoniec sme videli výhody a nevýhody týchto dohliadaných algoritmov strojového učenia.

Odporúčané články

Toto je sprievodca, čo je vzdelávanie pod dohľadom? Tu diskutujeme pojmy, ako to funguje, typy, výhody a nevýhody supervízovaného učenia. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je hlboké vzdelávanie
  2. Dozorované učenie vs hlboké učenie
  3. Čo je synchronizácia v jazyku Java?
  4. Čo je to webhosting?
  5. Spôsoby, ako vytvoriť rozhodovací strom s výhodami
  6. Polynomická regresia Použitie a funkcie

Kategórie: