Úvod do typov algoritmov strojového učenia

Typy algoritmov strojového učenia alebo výpočty AI sú programy (matematika a zdôvodnenie), ktoré sa upravujú tak, aby dosiahli lepšiu výkonnosť, keď sú prezentované ďalším informáciám. „Prispôsobenie“ určitej časti AI znamená, že tieto projekty menia spôsob spracovania informácií po určitom čase, rovnako ako ľudia menia spôsob spracovania informácií učením. Strojové učenie alebo výpočet umelej inteligencie je teda program s konkrétnou metódou na zmenu svojich vlastných parametrov, vzhľadom na kritiku svojich minulých výstavníckych očakávaní týkajúcich sa súboru údajov.

Všetky typy algoritmov strojového učenia

Ich rôzne variácie, ako charakterizovať druhy typov algoritmov strojového učenia, sa zvyčajne dajú rozdeliť do tried podľa ich motivácie a základné klasifikácie sú sprievodné:

  1. Vedenie pod dohľadom
  2. Učenie bez dozoru
  3. Výučba s polovičným dohľadom
  4. Posilnenie učenia

Čo je učenie pod dohľadom

Dohliadané učenie je miesto, kde môžete zvážiť, či je učenie vedené inštruktorom. Máme dataset, ktorý funguje ako pedagóg a jeho úlohou je pripraviť model alebo stroj. Keď sa model pripraví, môže sa začať zaoberať očakávaním alebo výberom, keď mu budú poskytnuté nové informácie.

Príklad učenia pod dohľadom:

  1. Získate veľa fotografií s údajmi o tom, čo je na nich, a potom trénujete model na vnímanie nových fotografií.
  2. Máte veľa údajov o cenách nehnuteľností na základe ich veľkosti a umiestnenia a vložíte ich do modelu a zaškolíte ho, potom môžete na základe údajov, ktoré vložíte, predpovedať cenu ďalších domov.
  3. Ak chcete predpovedať, že vaša správa je spam alebo nie je založená na staršej správe, môžete predpovedať, že nová správa je spam alebo nie.

Algoritmus učenia pod dohľadom je nasledujúci:

1) Lineárna regresia

lineárna regresia je cenná na odhalenie spojenia medzi dvoma pretrvávajúcimi faktormi. Jeden je prediktor alebo autonómna premenná a druhý je reakčný alebo ochranný. Hľadá merateľný vzťah, nie však deterministický vzťah. Spojenie medzi dvoma faktormi sa považuje za deterministické, pokiaľ ide o pravdepodobnosť, že jedna premenná môže byť presne sprostredkovaná druhou. Napríklad pri použití teploty v stupňoch Celzia je možné presne predvídať Fahrenheita. Skutočný vzťah nie je presný pri rozhodovaní o prepojení medzi dvoma faktormi. Napríklad pripojenie niekde v rozsahu výšky a hmotnosti. Ústrednou myšlienkou je získať čiaru, ktorá najlepšie vyhovuje informáciám. Najpriaznivejšia línia je taká, pre ktorú je celková prognóza omylu (všetky informačné zamerania) tak nízka, ako by sa dalo za daných okolností očakávať. Chyba je oddelenie medzi bodom k regresnej priamke.

2) Rozhodovacie stromy

Strom rozhodovania je pomôcka na pomoc pri rozhodovaní, ktorá používa stromový diagram alebo model rozhodnutí a ich potenciálne výsledky vrátane výsledkov náhodných udalostí, nákladov na zdroje a užitočnosti. Preskúmajte obrázok a získajte sentiment toho, čo pripomína.

3) Klasifikácia Naive Bayes

Klasifikácia Naive Bayes je skupina základných pravdepodobnostných klasifikátorov závislých od aplikácie Bayesovej teórie so silnou (neofistikovanou) samosprávou funkcií Naive Bayes. Táto klasifikácia Niektoré z certifikovateľných modelov sú:

Označenie pečiatky e-mailom ako spam alebo nie

Objednajte si spravodajský príbeh o inováciách, vládnych otázkach alebo športe

Skontrolujte dotyk látky dodávajúcej pozitívne emócie alebo negatívne pocity?

Využíva sa na programovanie potvrdenia tváre.

4) Logistická regresia

Logistická regresia je prelomovou faktickou metódou na preukázanie binomického výsledku s aspoň jedným informačným faktorom. Kvantifikuje súvislosť medzi premennou absolútneho oddelenia a najmenej jedným faktorom, ktorý hodnotí pravdepodobnosť pomocou logistickej kapacity, čo je kombinovaná logistika.

Normálne bude regresia použiteľná v reálnom živote, ako napríklad:

Kreditné skóre

Miera úspešnosti trhu alebo spoločnosti

Predpovedať príjmy akejkoľvek spoločnosti alebo akéhokoľvek produktu

Vyskytne sa v ktorýkoľvek deň zemetrasenie?

5) Bežná regresia najmenších štvorcov

Najmenšie štvorce sú stratégiou na vykonávanie priamej regresie. priama regresia je záväzok prispôsobiť líniu mnohým zameraniam. Existujú rôzne potenciálne postupy, ako to urobiť, a systém „obyčajných najmenších štvorcov“ vyzerá takto - môžete nakresliť čiaru a potom pre všetky dátové centrá zmerať vertikálne oddelenie medzi bodom a čiarou a začleniť ich up; osadená čiara by bola miestom, kde je táto skupina priečok taká nízka, ako by mohla byť normálna vzhľadom na súčasnú situáciu.

Čo je to učenie bez dozoru?

Model sa učí vnímaním a odhaľuje štruktúry informácií. Keď je modelu daný súbor údajov, následne zistí príklady a spojenia v súbore údajov vytvorením zväzkov. To, čo nemôže urobiť, je pridať do zväzku známky, podobne ako to nemôže povedať, že ide o zhromaždenie jabĺk alebo manga, ale izoluje všetky jablká od manga.

Predpokladajme, že sme zobrazili obrázky jabĺk, banánov a manga podľa modelu, takže podľa toho, čo robí, na základe určitých príkladov a spojení vytvára zväzky a delí množinu údajov do týchto skupín. V súčasnosti, ak je k modelu posilnená iná informácia, pridá ju do jedného z vyrobených zväzkov.

Príklad učenia bez dozoru

  1. Máte veľa fotografií 6 jednotlivcov, ale zatiaľ nemáte údaje o tom, kto je na ktorom a je potrebné izolovať tento súbor údajov do 6 hromád, z ktorých každá obsahuje fotografie jednej osoby.
  2. Máte častice, niektoré z nich sú lieky a časť si však neuvedomujete, ktorá bude a budete potrebovať výpočet, aby ste našli lieky.

Algoritmus učenia bez dozoru je nasledujúci

clustering

Zhlukovanie je významnou myšlienkou, pokiaľ ide o vzdelávanie bez pomoci. Z väčšej časti sa podarí nájsť štruktúru alebo príklad pri zhromažďovaní nekategorizovaných informácií. Výpočty zoskupovania spracujú vaše informácie a objavia charakteristické zoskupenia (skupiny) v prípade, že v informáciách existujú. Podobne môžete zmeniť, aký počet zväzkov by sa vaše výpočty mali rozlišovať. Umožňuje vám zmeniť podrobnosti týchto stretnutí.

Existuje niekoľko druhov klastrov, ktoré môžete použiť

  1. Selektívne (rozdelenie)
  2. Model: K-znamená
  3. aglomerativní
  4. Model: Hierarchické zoskupovanie
  5. Krytina
  6. Model: Fuzzy C-znamená
  7. pravdepodobnostné

Typy algoritmov zoskupovania

  1. Hierarchické zoskupovanie
  2. K znamená zhlukovanie
  3. K-NN (k najbližší susedia)
  4. Analýza hlavných komponentov
  5. Rozklad solitárnej hodnoty
  6. Analýza nezávislých komponentov
  7. Hierarchické zoskupovanie
Hierarchické zoskupovanie

Hierarchické zoskupovanie je výpočet, ktorý vytvára poradie zoskupovania skupín. Začína sa každou informáciou, ktorá sa podáva na ich vlastnej partii. Tu budú dve podobné skupiny v podobnom zväzku. Tento výpočet sa uzavrie, keď zostane iba jedna skupina.

K-znamená zoskupovanie

K znamená, že je to iteratívny výpočet zoskupovania, ktorý vás povzbudí, aby ste našli každý pozoruhodný stimul pre každý dôraz. Najprv sa vyberie ideálny počet skupín. V tejto technike klastrovania musíte zhromaždiť informácie, ktoré sa zameriavajú na zhromaždenia k. Väčšie k znamená podobne menšie zhromaždenia s väčšou granularitou. Nižšie k znamená väčšie zhromaždenia s menšou granularitou.

Výťažkom výpočtu je zhromaždenie „mien“. Umožňuje informácie poukazovať na jedno z zhromaždení k. V zhlukoch k-znamená každé zhromaždenie charakterizovať vytvorením ťažiska pre každé zhromaždenie. Ťažiská sú ako jadro zväzku, ktoré zachytáva ohniská najbližšie k nim a pridáva ich do skupiny.

K-stredné zoskupovanie ďalej charakterizuje dve podskupiny

  1. Aglomeračné zoskupovanie
  2. dendrogram
Aglomeračné zoskupovanie

Tento druh K-znamená zoskupovanie začína pevným počtom strapcov. Označuje všetky informácie do presného počtu skupín. Táto klastrová stratégia nevyžaduje počet skupín K ako informácie. Aglomeračná procedúra začína formovaním každého počiatočného bodu ako osamelý zväzok.

Táto stratégia využíva určité separačné opatrenie, kombináciou procesu znižuje počet strapcov (jeden v každom dôraze). Na záver máme jednu významnú skupinu, ktorá obsahuje každý jeden z článkov.

dendrogram

V technike klastrovania dendrogramu bude každá úroveň hovoriť s predstaviteľným zväzkom. Výška dendrogramu ukazuje stupeň podobnosti medzi dvoma spojovacími zväzkami. Čím bližšie k základu postupu, sú postupne porovnateľné partia, ktorá je nález zhromaždenia z dendrogramu, ktorý nie je charakteristický a z väčšej časti abstrakt.

K-najbližší susedia

K-najbližší sused je najpriamejší zo všetkých klasifikátorov AI. Od ostatných postupov AI sa líši tým, že nedodáva model. Je to jednoduchý výpočet, ktorý ukladá každý jednotlivý prístupný prípad a charakterizuje nové príklady v závislosti od miery podobnosti.

Funguje to veľmi dobre, keď existujú rozdiely medzi modelmi. Ak je prípravná súprava obrovská a miera separácie je netriviálna, miera učenia je mierna.

Analýza hlavných komponentov

Je pravdepodobné, že budete potrebovať priestor vyššej dimenzie. Musíte si vybrať dôvod tohto priestoru a len 200 najvýznamnejších skóre tohto predpokladu. Táto báza je známa ako hlavný komponent. Podmnožina, ktorú vyberiete, pozostáva z iného priestoru, ktorého veľkosť nie je v kontraste s jedinečným priestorom. Zachováva však mnohostranné informácie, ako sa dá očakávať.

Čo je výučba posilnenia?

Je to schopnosť špecialistu spolupracovať so Zemou a zistiť, aký je najlepší výsledok. Sleduje myšlienku zásahu a predbežnej techniky. Prevádzkovateľ je odmeňovaný alebo potrestaný bodom za správnu odpoveď alebo odpoveď mimo základne a na základe kladov zameraných na pozitívnu odmenu vyzdvihol modelové vlaky sám. Akonáhle sa raz pripraví, pripraví sa na predvídanie nových informácií, ktoré sa mu predložia.

Príklad výučby posilnenia

  1. Zobrazovanie reklám sa podľa používateľov, ako sú nepáči, optimalizuje na dlhé obdobie
  2. Poznajte rozpočet reklám používaný v reálnom čase
  3. inverzné posilňovanie učenia, aby sa zákazníci lepšie obľubovali

Čo je to učenie s polovičným dohľadom?

Výučba s polovičným dohľadom je vypočítaná na základe kombinácie pomenovaných a neznačených informácií. Normálne bude táto zmes obsahovať obmedzené množstvo menovaných informácií a veľa neznačených informácií. Základnou metódou je to, že po prvé, softvérový inžinier zoskupí porovnateľné informácie pomocou výpočtu bez pomoci učenia a potom použije aktuálne pomenované informácie na pomenovanie zvyšku neznačených informácií. Bežné prípady použitia takéhoto druhu výpočtu majú medzi nimi typickú vlastnosť - Získanie neznačených informácií je spravidla skromné, zatiaľ čo pomenovanie uvedených informácií je nadmierne drahé. Prirodzene, možno si predstaviť tri druhy výpočtov výučby ako supervidované uvedomenie si, že podvedomie je pod dohľadom inštruktora doma aj v škole, nesledované uvedomenie si, že podvedomie potrebuje zmysel pre samotný nápad a polokontrolované uvedomenie si, že pedagóg ukazuje niekoľko nápadov v triede a dáva otázky ako práca v škole, ktoré závisia od porovnateľných nápadov.

Príklad učenia s polovičným dohľadom

Je vynikajúce, že viac informácií = kvalitnejšie modely pri hlbokom učení (až do určitého bodu zadržania jasne, ale častejšie ako ne, nemáme toľko informácií.) Čiže je to možné, získanie označených informácií je nákladné. V prípade, že potrebujete pripraviť model na odlíšenie okrídlených zvierat, môžete nastaviť množstvo kamier na následné fotografovanie hydiny. To je spravidla skromné. Zmluvné osoby označiť tieto fotografie sú nákladné. Zvážte možnosť, že máte ohromný počet obrázkov okrídlených zvierat, stačí si však jednotlivcov dohodnúť, aby označili malú podskupinu fotografií. Ukázalo sa, že namiesto jednoduchého tréningu modelov na označenej podmnožine môžete model vopred trénovať na celej tréningovej sade a až potom ho vylepšiť pomenovanou podmnožinou. To je učenie pod dohľadom. Odloží to vašu hotovosť.

záver

Existuje veľa typov algoritmov strojového učenia a na základe rôznych rôznych podmienok musíme pre najlepší výsledok použiť algoritmus najlepšieho nasadenia. Existuje veľa algoritmov, ktoré nájdu najlepšiu presnosť každého typu algoritmu strojového učenia a ktorá je najvyššia presnosť, ktorú musíme tento algoritmus použiť. Môžeme minimalizovať chybu každého algoritmu znížením šumu v údajoch. Nakoniec poviem, že neexistuje jediný algoritmus strojového učenia, ktorý by vám mohol poskytnúť stopercentnú presnosť, dokonca ani ľudský mozog to nedokáže urobiť, a tak nájsť najlepší jedľový algoritmus pre vaše údaje.

Odporúčané články

Toto je príručka k typom algoritmov strojového učenia. Tu diskutujeme o tom, čo je algoritmus strojového učenia? A jeho typy zahŕňajú učenie pod dohľadom, učenie bez dozoru, učenie pod dohľadom, učenie posilnenia. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Metódy strojového učenia
  2. Knižnice strojového učenia
  3. Modely strojového učenia
  4. Rámce strojového učenia
  5. Hyperparameter Machine Learning
  6. Hierarchické zoskupovanie Aglomeračné a deliace sa zoskupovanie
  7. Vytvoriť rozhodovací strom Ako vytvoriť výhody
  8. Životný cyklus strojového učenia 8 najlepších etáp

Kategórie: