Úvod do strojového učenia bez dozoru

Už ste niekedy premýšľali o tom, ako je dieťa schopné rozlíšiť jablká a pomaranče, keď nevie, čo vlastne sú, ako chutia, ale podľa farby a veľkosti ich môže rozdeliť do 2 skupín bez akýchkoľvek predchádzajúcich informácií? Môžeme očakávať rovnakú segmentáciu ako dieťa od strojov, ak dostanú informácie o farbe a veľkosti? Pozrime sa, ako to môžeme urobiť! V tejto téme sa dozvieme o strojovom učení bez dozoru.

„Strojové učenie“, ako tento pojem naznačuje, učíme stroje na vykonávanie úloh podobných ľuďom a ako sa ľudia učia, buď od niekoho, alebo pozorovaním. Rovnako ako u ľudí, spôsob, akým sa stroj učí.

Strojové učenie možno rozdeliť na 3 časti: -

  1. Vedenie pod dohľadom
  2. Výučba bez dozoru
  3. Posilnenie učenia

Druhy strojového učenia

Učenie o posilňovaní je učenie založené na agentoch, ktoré zahŕňa odmenu a trest za kroky podniknuté agentom. Konečným cieľom je maximalizovať celkovú odmenu v procese učenia sa z prostredia.

Ak máte napríklad vstupno-výstupné údaje, v krátkosti, napríklad označené údaje, daná výška a váha na určenie, či je osoba muž alebo žena, možno považovať za úlohu učenia pod dohľadom (od niekoho v prípade ľudí).

V mnohých scenároch skutočného života však tieto označené alebo komentované údaje nie sú vždy k dispozícii. Mnohokrát čelíme problémom segmentácie objektov na základe ich vlastností, ktoré nie sú výslovne uvedené. Ako vyriešiť tento problém? Riešením je učenie bez dozoru.

Wikipedia hovorí, že učenie bez dozoru je druh samoorganizovaného hebbského učenia, ktorý pomáha nájsť predtým neznáme vzory v množine údajov bez už existujúcich štítkov. V učení bez dozoru nemáme žiadne informácie o značke, ale napriek tomu chceme získať informácie z údajov na základe rôznych vlastností.

Druhy strojového učenia bez dozoru

Nesledované vzdelávacie úlohy možno vo všeobecnosti rozdeliť do 3 kategórií:

  1. Ťažba pravidiel združovania
  2. clustering
  3. Systém odporúčaní

1. Ťažba podľa pravidiel pridruženia

Keď máme údaje o transakciách pre niečo, môže to byť pre predané produkty alebo akékoľvek transakčné údaje týkajúce sa tejto záležitosti, chcem vedieť, existuje nejaký skrytý vzťah medzi kupujúcim a produktmi alebo produktmi k produktu, takže môžem nejako tieto informácie využiť zvýšiť môj predaj. Vyťaženie týchto vzťahov je jadrom ťažby podľa pravidiel pridruženia. Na extrakciu vzťahov môžeme použiť rastové algoritmy AIS, SETM, Apriori, FP.

2. Zhlukovanie

Zhlukovanie je možné vykonať v prípade akýchkoľvek údajov, kde nemáme informácie o triede alebo označení. Chceme zoskupiť údaje tak, aby pozorovania s podobnými vlastnosťami patrili do rovnakého klastra / skupiny a vzdialenosť medzi klastrami by mala byť maximálna. Keďže vzdialenosť vnútri klastra by mala byť minimálna. Údaje voliča môžeme zoskupiť, aby sme zistili názor na vládu alebo zoskupenie produktov na základe ich funkcií a použitia. Segmentujte populáciu na základe príjmových funkcií alebo použite zoskupovanie v predaji a marketingu.

Môžeme použiť K-prostriedky, K-prostriedky ++, K-medoidy, fuzzy C-prostriedky (FCM),

Očakávanie - maximalizácia (EM), aglomeračné zoskupovanie, DBSCAN, typy hierarchického zoskupovania ako jednoduché prepojenie, úplné prepojenie, stredné spojenie, algoritmy Wardovej metódy na zhlukovanie.

3. Systém odporúčaní

Systém odporúčaní je v podstate rozšírením ťažby pravidiel pridruženia v tom zmysle, že v ARM extrahujeme vzťahy a v systéme odporúčaní využívame tieto vzťahy na odporúčanie niečoho, čo má väčšie šance na prijatie zo strany koncového používateľa. Odporúčacie systémy získali popularitu po tom, čo Netflix v roku 2009 vyhlásil hlavnú cenu 1 000 000 USD.

Systém odporúčaní pracuje na transakčných údajoch, či už ide o finančné transakcie, transakcie elektronického obchodu alebo obchodu s potravinami. V súčasnosti obrovskí hráči v odvetví elektronického obchodu lákajú zákazníkov tým, že každému používateľovi dávajú prispôsobené odporúčanie na základe jeho minulých nákupných histórií a podobných údajov o nákupe správania od ostatných používateľov.

Metódy na vývoj odporúčacích systémov možno vo všeobecnosti rozdeliť na spoločné filtrovanie a filtrovanie podľa obsahu. Pri kooperatívnom filtrovaní máme opäť užívateľsko-kooperatívne filtrovanie a koľajové filtrovanie podľa položky, ktoré sú prístupmi založenými na pamäti a faktorizáciou matíc a rozkladom singulárnej hodnoty (SVD) sú prístupy založené na modeloch.

Aplikácie učenia bez dozoru

Keďže svetové dáta každý deň ohromne rastú, vzdelávanie bez dozoru má mnoho aplikácií. Údaje vždy vytvárame pomocou platforiem sociálnych médií alebo nejakého videoobsahu na YouTube a mnohokrát to ani nie je zámerné. Všetky tieto údaje sú neštruktúrované a ich označovanie pre vzdelávacie úlohy pod dohľadom bude únavné a drahé.

Nasleduje niekoľko vynikajúcich aplikácií strojového učenia bez dozoru.

  1. Obchod s potravinami alebo e-commerce: Výpis pravidlá pridruženia od zákazníkov transakčné údaje a odporúčania pre spotrebiteľov na nákup produktov.
  2. Platforma sociálnych médií: extrahujte vzťahy s rôznymi používateľmi a navrhujte produkty alebo služby. Odporučiť novým ľuďom sociálne kontakty.
  3. Služby: odporúčania cestovných služieb, odporúčanie prenájmu domov alebo sprostredkovanie zápasu.
  4. Bankovníctvo: Zákazníci zoskupení podľa ich finančných transakcií. Klamlivá podvodná transakcia na zisťovanie podvodov.
  5. Politika: Názory voličov klastra na šance na výhru pre konkrétnu stranu.
  6. Vizualizácia dát: Pomocou zoskupovania a t-distribuovaného vloženia stochastických susedov (t-SNE) môžeme vizualizovať vysokorozmerné údaje. To sa dá použiť aj na zníženie rozmerov.
  7. Zábava: Odporúčania pre filmy, hudbu, ako to robia Netflix a Amazon.
  8. Segmentácia obrázkov : Zhlukujte časti obrázkov na základe najbližších hodnôt pixlov.
  9. Obsah: personalizované noviny, odporúčania webových stránok, e-learningové aplikácie a e-mailové filtre.
  10. Štrukturálny objav: Pomocou klastrovania môžeme zistiť akúkoľvek skrytú štruktúru v údajoch.

záver

Strojové učenie bez dozoru nie je príliš vyčísliteľné, ale môže vyriešiť veľa problémov, pri ktorých zlyhávajú supervidované algoritmy. Existuje mnoho aplikácií na učenie bez dozoru v mnohých doménach, kde máme nestrukturované a neznačené údaje. Môžeme používať učebné techniky bez dozoru, aby sme naše stroje naučili robiť lepšiu prácu ako my. V posledných rokoch stroje prekonali ľudí, pokiaľ ide o úlohy, ktoré sa považujú za vyriešené ľuďmi po celé storočia. Dúfam, že v tomto článku ste pochopili, čo je a ako možno na riešenie problémov v skutočnom svete použiť techniky strojového učenia bez dozoru.

Odporúčané články

Toto je príručka k strojovému učeniu bez dozoru. Tu diskutujeme o typoch strojového učenia a druhoch strojového učenia bez dozoru spolu s jeho aplikáciami. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Algoritmy strojového učenia
  2. Čo je to strojové učenie?
  3. Úvod do strojového učenia
  4. Nástroje strojového učenia
  5. Klastrovanie v strojovom učení
  6. Hyperparameter Machine Learning
  7. Hierarchický klastrovací algoritmus
  8. Hierarchické zoskupovanie Aglomeračné a deliace sa zoskupovanie
  9. Top 8 etáp životného cyklu strojového učenia

Kategórie: