Klastrovanie v strojovom učení Najčastejšie metódy a aplikácie

Obsah:

Anonim

Úvod do klastrov v strojovom učení

Najskôr pochopíme strojové učenie. Vidíme, že okolo nás údaje rýchlo rastú. Dáta prichádzajú v rôznych formách, ako je video, audio, obrázky atď. Zhlukovanie v strojovom učení používa tieto údaje na zodpovedanie otázky. Napríklad (detekcia kožných ochorení), lekár použije strojové učenie na pochopenie známky na koži a predpovedá, o aký druh ochorenia ide. Zhlukovanie nie je nič iné ako zoskupovanie neoznačených súborov údajov. Zoberme si príklad svojho filmu (ktorý chcete sledovať). Možno sa vám páčia romantické filmy, ale vaša sestra má rada komediálne filmy. Mohli by ste mať radi romantické filmy Bollywood alebo romantické filmy Hollywoodu. Ale vaša sestra má rád komediálne filmy od Telegu, tu vás vidíme a vaša sestra má iný výber filmov. Obaja ste objavili hĺbkové informácie o filmoch. Tu sme zoskupili neoznačenú množinu údajov (filmy), aby sme mohli sledovať film.

Ako funguje zoskupovanie v strojovom učení?

Pri klastrovaní zoskupujeme neoznačené súbory údajov, ktoré sa nazývajú nepodrobené učenie. Keď sme prvýkrát zoskupili neoznačené údaje, musíme nájsť podobnú skupinu. Keď vytvárame skupinu, musíme pochopiť vlastnosti súborov údajov, tj podobné veci. Ak vytvoríme skupinu pomocou jednej alebo dvoch funkcií, je ľahké merať podobnosť.

  • Príklad č. 1: Filmy režiséra. Po dokončení klastrovania je každému klastru pridelené číslo klastra známe ako ClusterID. Systém strojového učenia, ako je YouTube, používa clusterID na jednoduchšie reprezentovanie komplexných údajov.
  • Príklad č. 2: YouTube používa našu históriu vyhľadávania alebo sledovanú históriu a navrhuje videá, ktoré by sme mohli mať radi. Súbor údajov funkcie pre Facebook obsahuje ľudí, ktorých sledujeme, stránky, ktoré sledujeme, komentáre, ktoré zadávame, fotografie alebo videá, ktoré sa nám páčia, obrázky alebo fotografie, na ktorých sa nachádzame. Zhlukovanie videa alebo fotografie na Facebooku nahradí skupinu funkcií jediným klastrovým identifikátorom kvôli kompresii údajov.

Top 4 metódy zoskupovania v strojovom učení

Nižšie sú uvedené metódy zoskupovania v strojovom učení:

1. Hierarchické

Klastrovanie mien definuje spôsob práce, táto metóda vytvára klaster hierarchickým spôsobom. Nový klaster je vytvorený pomocou predtým vytvorenej štruktúry. Musíme pochopiť rozdiely medzi deliacim sa prístupom a aglomeračným prístupom. Aglomerát je prístup zdola nahor, začína individuálnymi bodmi v zoskupení a kombinuje niektoré svojvoľné. Divisive začína jedným klastrom, všetky body v klastri a rozdelia ho do viacerých klastrov.

2. Na základe hustoty

V tejto metóde sa hustá oblasť považuje za zhluk, ktorý má určité podobnosti. Odlišuje sa od dolnej hustej oblasti priestoru objektov. DBSCAN je známy ako priestorové zoskupovanie aplikácií založené na hustote s hlukom. Pre orientáciu dátových objektov DBSCAN hľadá nejaký epsilon, ktorý nastavíme nejaký epsilon polomeru a minimálny počet bodov. Ak v rámci okruhu prekročíme určitý minimálny počet bodov, hodnotíme zhluk vysokej hustoty. Týmto spôsobom môžeme brať do úvahy údaje s regiónom s vysokou hustotou. DBSCAN sa líši od metódy centroidného zoskupovania, pretože nejde o prísny prístup. Hlukové body sú body v oblastiach s nízkou hustotou, ktoré sú ponechané neznačené alebo označené ako odľahlé hodnoty. To je dôvod, prečo nevyžadujeme konkrétne K. Môžeme určiť minimálne body pre oblasť s vysokou hustotou a polomer, ktorý chceme, aby región bol alebo aby boli zoskupenia.

3. Delenie disku

Keď máme dataset N počtu objektov. Táto metóda vytvára „K“ ako oddiel údajov. Tento oddiel je klaster, tj konštrukt K, oddiel (K <= N).

Požiadavky, ktoré musia byť splnené:

  • Každá skupina alebo súbor údajov musí obsahovať aspoň jeden objekt.
  • Každý objekt by mal patriť iba do jednej skupiny.

Jedným z príkladov rozdelenia je K-klastrovanie.

4. Na báze mriežky

Priestor objektov, konečný počet buniek tvorí mriežkovú štruktúru. Táto metóda poskytuje rýchle spracovanie klastrov. Sú nezávislé na objekte.

Aplikácie klastrov v strojovom učení

Nižšie sú uvedené aplikácie Clustering in Machine Learning:

1. Lekárske

Lekár môže na zistenie choroby použiť zhlukový algoritmus. Zoberme si príklad choroby štítnej žľazy. Súbor údajov o ochoreniach štítnej žľazy možno identifikovať pomocou algoritmu zoskupovania, keď aplikujeme nekontrolované učenie sa na súbor údajov, ktorý obsahuje súbor štítnej žľazy a štítnej žľazy. Zhlukovanie identifikuje príčinu choroby a umožní úspešné vyhľadávanie výsledkov.

2. Sociálna sieť

Sme generácia internetovej éry, môžeme sa stretnúť s akoukoľvek osobou alebo sa dozvedieť o akejkoľvek individuálnej identite prostredníctvom internetu. Webové stránky sociálnych sietí používajú zoskupovanie na porozumenie obsahu, tvárou alebo polohe používateľa. Ak sa v spoločnosti používa učenie bez dozoru, je to užitočné pre preklad jazyka. Napríklad Instagram a Facebook poskytujú funkciu prekladu jazyka.

3. Marketing

Vidíme alebo pozorujeme, že vedľa nás rastú rôzne technológie a že ľudia priťahujú používanie týchto technológií, ako je cloud, digitálny marketing. Každá spoločnosť vyvíja ľahko použiteľné funkcie a technológie, aby pritiahla väčší počet zákazníkov. Aby sme pochopili zákazníka, môžeme použiť klastrovanie. Zoskupovanie pomôže spoločnosti porozumieť segmentu používateľov a potom kategorizovať každého zákazníka. Týmto spôsobom dokážeme zákazníkovi porozumieť a nájsť podobnosti medzi zákazníkmi a zoskupiť ich.

4. Bankovníctvo

Všimli sme si, že sa okolo nás deje podvod a spoločnosť varuje zákazníkov. S pomocou zoskupovania môžu poisťovacie spoločnosti nájsť podvod, informovať o ňom zákazníkov a porozumieť politikám, ktoré prináša.

5. Google

Google je jedným z vyhľadávacích nástrojov, ktoré ľudia používajú. Urobme príklad, keď budeme hľadať nejaké informácie, ako je predajňa domácich miláčikov v tejto oblasti, spoločnosť Google nám poskytne rôzne možnosti. Je to výsledok zoskupovania, zoskupovania podobného výsledku, ktorý sa vám poskytuje.

záver

Dozvedeli sme sa o klastrovaní a strojovom učení. Spôsob zoskupovania funguje v strojovom učení. Informácie o učení bez dozoru. Využitie učenia bez dozoru v reálnom čase. Metódy zoskupovania a ako každá metóda funguje v strojovom učení.

Odporúčaný článok

Toto je sprievodca zoskupovaním v strojovom učení. Tu diskutujeme o 4 najlepších metódach zoskupovania v strojovom učení spolu s aplikáciami. Viac informácií nájdete aj v ďalších navrhovaných článkoch -
  1. Rámce strojového učenia Top 10
  2. K- Znamená zhlukovací algoritmus s výhodami
  3. Úvod do techniky strojového učenia
  4. Modely strojového učenia Top 5 typov
  5. Knižnica strojového učenia C ++