Úvod do učenia pod dohľadom a učenia bez dozoru

Dozorované učenie a učenie bez dozoru sú úlohy strojového učenia.
Dozorované učenie je jednoducho proces algoritmu učenia sa zo súboru údajov o školení. Dohliadané učenie je miesto, kde máte vstupné premenné a výstupné premenné a pomocou algoritmu sa naučíte funkciu mapovania od vstupu po výstup. Cieľom je aproximovať funkciu mapovania tak, aby sme pri nových vstupných údajoch mohli predpovedať výstupné premenné pre tieto dáta.

Neupozorňované učenie je modelovaním základnej alebo skrytej štruktúry alebo distribúcie v údajoch s cieľom dozvedieť sa viac o údajoch. Učenie bez dozoru je miesto, kde máte iba vstupné údaje a žiadne zodpovedajúce výstupné premenné.

Súbor údajov o školení: Súbor príkladov používaných pri učení, kde je známa cieľová hodnota.

Porovnania medzi jednotlivými učiteľmi medzi učením pod dohľadom a učením bez dozoru (infografika)

Ďalej uvádzame porovnanie medzi supervidovaným vzdelávaním a učením bez dozoru

Kľúčové rozdiely medzi učením pod dohľadom a učením bez dozoru

Nižšie sú uvedené zoznamy bodov, opíšte kľúčové rozdiely medzi učením pod dohľadom a učením bez dozoru

1. Algoritmy strojového učenia objavujú vzorce veľkých dát. Tieto rôzne algoritmy možno rozdeliť do dvoch kategórií na základe spôsobu, akým sa „učia“ o údajoch, aby urobili predpovede. Sú to učenia pod dohľadom a bez dozoru.

2. Vedec, ktorý sa vzdeláva pod dohľadom, slúži ako návod na naučenie algoritmu, s akými závermi alebo predikciami by mal prísť. V učení bez dozoru neexistuje správna odpoveď, neexistuje učiteľ, algoritmy sú ponechané na ich vlastné, aby odhalili a predstavili zaujímavú skrytú štruktúru v údajoch.

3. Model dozoru pod dohľadom bude využívať údaje z odbornej prípravy, aby sa naučil spojenie medzi vstupom a výstupmi.

4. Neupozorňované učenie nepoužíva výstupné údaje. V učení bez dozoru nebudú „žiadnymi“ predchádzajúcimi znalosťami označenými, zatiaľ čo pri učení pod dohľadom bude mať prístup k označeniam a budú mať predchádzajúce znalosti o súboroch údajov

5. Učenie pod dohľadom: Ide o to, aby sa školenie dalo zovšeobecniť a model by sa mohol s určitými presnosťami použiť na nové údaje.

6. Riadené algoritmy učenia: Podporný vektorový stroj, lineárna a logická regresia, neurónová sieť, klasifikačné stromy a náhodný les atď.

7. Algoritmy bez dozoru je možné rozdeliť do rôznych kategórií: klastrové algoritmy, K-prostriedky, hierarchické zoskupovanie, algoritmy rozmerovej redukcie, detekcie anomálií atď.

8. Klasifikačná a regresná oblasť, bežne používané algoritmy v učení pod dohľadom. Podporné vektorové stroje (SVM) sú dohliadané modely strojového učenia s pridruženými učebnými algoritmami, ktoré možno použiť na účely klasifikácie aj regresie, ale väčšinou sa používajú na problémy klasifikácie.

9. Vo SVM modeli vykreslujeme každú dátovú položku ako bod v n-rozmernom priestore (kde n sú vlastnosti, ktoré máme), pričom hodnoty každého prvku sú hodnotou konkrétnej súradnice. Potom bola klasifikácia vykonaná nájdením hyperplánu, ktorý rozlišuje tieto dve triedy.

10. Hlavným cieľom regresných algoritmov je predpovedať diskrétnu alebo pokračujúcu hodnotu. V niektorých prípadoch sa predpovedaná hodnota môže použiť na identifikáciu lineárneho vzťahu medzi atribútmi. Na základe problému môžu byť použité regresné algoritmy. Niektoré zo základných regresných algoritmov sú lineárna regresia, polynomická regresia atď.

11. Clustering je široko používaný v učení bez dozoru. Zhlukovanie je úlohou rozdelenia údajových bodov do počtu skupín tak, aby rovnaké znaky boli spolu vo forme zhluku. Existuje viac algoritmov zoskupovania; málo z nich sú modely konektivity, modely centroidov, modely distribúcie a modely hustoty.

12.Hierarchické zoskupovanie spadá pod učenie bez dozoru. Hierarchické zoskupovanie, ako už názov napovedá, je algoritmus, ktorý vytvára hierarchiu klastrov. Tento algoritmus začína všetkými dátovými bodmi, ktoré sú priradené k ich vlastnému klastru. Potom sa dve najbližšie klastre zlúčia do jedného klastra. Nakoniec sa tento algoritmus skončí, keď zostane iba jeden klaster.

13.KMeans spadajú pod metódu klastrovania bez dozoru. Dáta budú rozdelené do klastrov k na základe ich vlastností. Každý klaster je reprezentovaný ťažiskom definovaným ako stred bodov v klastri. KMeans je jednoduchý a rýchly, ale pri každom behu neprináša rovnaký výsledok.

14.Aby sme lepšie porozumeli učeniu pod dohľadom a učeniu bez dozoru, vezmime príklady z reálneho života. Dozorované učenie: Ako príklad uvádzame jednu z funkcií Gmailu, ktorou je spam. Na základe minulých informácií o nevyžiadaných e-mailoch sa odfiltruje nový prichádzajúci e-mail do priečinka Doručená pošta alebo Nevyžiadaná pošta. V tomto scenári je služba Gmail modelovaná ako funkcia mapovania, aby sa oddelila prichádzajúca pošta na základe predchádzajúcich poznatkov o pošte, čo je učenie pod dohľadom.

15. Nepodporované učenie: Predpokladajme, že vás priateľ pozve na jej večierok, kde stretnete nových ľudí. Teraz ich klasifikujete pomocou predchádzajúcich znalostí (učenie bez dozoru) a táto klasifikácia by mohla byť na akomkoľvek znaku. Môže to byť veková skupina, pohlavie, obliekanie, vzdelanie alebo akýkoľvek spôsob, akým by ste chceli. Keďže ste nevyužili žiadne predchádzajúce vedomosti o ľuďoch a klasifikovali ich, spadá to pod učenie bez dozoru.

Tabuľka s porovnaním učenia s porovnaním bez dozoru

Učenie pod dohľadomUčenie bez dozoru

metóda

Uvádzajú sa vstupné premenné a výstupné premenné.Uvádzajú sa iba vstupné údaje

Cieľ

Cieľom sledovaného učenia je určiť funkciu tak dobre, aby pri zadaní nového súboru vstupných údajov mohla predvídať výstup.Cieľom sledovania bez dozoru je modelovať skryté vzorce alebo základnú štruktúru v daných vstupných údajoch, aby sa o týchto údajoch dozvedeli.

Trieda

Problémy strojového učenia, ťažba dát a neurónová sieť,Strojové učenie, ťažba dát, problémy a neurónová sieť

Príklady

  • klasifikácia
  • regresia
  • Lineárna regresia
  • Podpora vektorového stroja
  • clustering
  • združenie
  • k-means
  • združenie
Kto používaVedci údajovVedci údajov

ekosystémy

Spracovanie veľkých dát, dolovanie dát atď

Spracovanie veľkých dát, dolovanie dát atď

použitie

Dozorované učenie sa často používa pri exportných systémoch pri rozpoznávaní obrázkov, rozpoznávaní reči, predpovedaní, finančnej analýze a školení neurónových sietí a rozhodovacích stromov atď.

Neupozorované algoritmy učenia sa používajú na predspracovanie údajov, počas exploračnej analýzy alebo na predbežnú prípravu učených algoritmov pod dohľadom.

Záver - učenie pod dohľadom vs učenie bez dozoru

Výber použitia algoritmu strojového učenia pod dohľadom alebo bez dozoru zvyčajne závisí od faktorov súvisiacich so štruktúrou a objemom vašich údajov a prípadom použitia. V skutočnosti vo väčšine prípadov vedci údajov používajú na riešenie prípadu použitia prístupy supervidované učenie aj nekontrolované učenie.

Odporúčaný článok

Bol to sprievodca supervízovaným vzdelávaním v porovnaní s učením bez dozoru, ich významom, porovnávaním medzi jednotlivými účastníkmi, kľúčovými rozdielmi, porovnávacou tabuľkou a záverom. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Najlepšie porovnanie 7 medzi učením pod dohľadom a výučbou posilnenia
  2. 5 najužitočnejších rozdielov medzi údajovou vedou a strojovým učením
  3. Naučte sa 10 najlepších rozdielov medzi mapou Znížiť vs Priadza
  4. MapReduce vs Apache Spark-20 Užitočné porovnania, ktoré je potrebné sa naučiť
  5. Čo je výučba posilnenia?

Kategórie: