Úvod do metód jadra v strojovom učení

Algoritmus používaný na analýzu vzorov sa v strojovom učení nazýva ako metóda jadra. Vo všeobecnosti sa analýza vykonáva s cieľom nájsť vzťahy v množinách údajov. Tieto vzťahy môžu byť zoskupovanie, klasifikácia, hlavné komponenty, korelácia, atď. Väčšina z týchto algoritmov, ktoré riešia tieto úlohy analýzy vzoru, Potrebujú údaje v nespracovanom zástupcovi, aby boli explicitne transformované do reprezentácie vektora funkcií. Túto transformáciu je možné vykonať pomocou užívateľsky špecifikovanej mapy funkcií. Môže sa teda vziať do úvahy, že metóda jadra vyžaduje iba jadro špecifikované používateľom.

Terminológia Kernal Method vychádza z faktu, že používajú funkciu jadra, ktorá im umožňuje vykonávať operáciu vo vysokorozmernom implicitnom priestore funkcií bez potreby výpočtu súradníc údajov v tomto priestore. Namiesto toho jednoducho vypočítajú vnútorný produkt medzi obrázkami všetkých párov údajov v priestore funkcií.

Tieto druhy operácií sú väčšinou výpočtovo lacnejšie v porovnaní s explicitným výpočtom súradníc. Táto technika sa nazýva „trik jadra“. Akýkoľvek lineárny model možno previesť na nelineárny model aplikáciou triku jadra na model.

Kernelská metóda dostupná v strojovom vzdelávaní je analýza základných komponentov (PCA), spektrálne zoskupovanie, podporné vektorové stroje (SVM), kanonická korelačná analýza, perceptrón jadra, gaussovské procesy, regresia hrebeňa, lineárne adaptívne filtre a mnoho ďalších. Poďme sa dobre zoznámiť s niektorými z týchto metód jadra.

Top 7 metód jadra v strojovom učení

Nižšie sú uvedené metódy jadra v strojovom vzdelávaní:

1. Analýza komponentov

Analýza hlavných komponentov (PCA) je technika na extrahovanie štruktúry z potenciálne vysokorozmerných súborov údajov. Ľahko sa vykonáva pomocou iteračných algoritmov, ktoré odhadujú hlavné komponenty alebo riešením problému s vlastnou hodnotou. PCA je ortogonálna transformácia súradnicového systému, v ktorom popisujeme naše údaje. Nový súradnicový systém sa získa projekciou na hlavné osi údajov. Malý počet hlavných komponentov je často dostatočný na to, aby zodpovedal za väčšinu štruktúry údajov. Jednou z jej hlavných aplikácií je vykonanie prieskumnej analýzy údajov na vytvorenie prediktívneho modelu. Väčšinou sa používa na vizualizáciu vzťahu medzi populáciami a genetickou vzdialenosťou.

2. Podpora Vector Machine

SVM možno definovať ako klasifikátor na oddeľovanie hyperjadra, kde je hyperjadrolok o jeden rozmer menší ako okolitý priestor. Rozmer tohto matematického priestoru je definovaný ako minimálny počet súradníc potrebných na určenie bodu, zatiaľ čo okolitý priestor je priestor, ktorý obklopuje matematický objekt. Matematický objekt sa teraz dá chápať ako abstraktný objekt, ktorý neexistuje v žiadnom momente ani na inom mieste, ale existuje ako určitý druh veci.

3. Gaussov proces

Gaussovský proces bol pomenovaný po Carkovi Friedrichovi Gaussovi, pretože používa zápis gaussovského rozdelenia (normálne rozdelenie). Je to stochastický proces, ktorý znamená súbor náhodných premenných indexovaných podľa času alebo priestoru. V Gaussovom procese majú náhodné premenné viacrozmerné normálne rozdelenie, tj všetky jeho konečné lineárne kombinácie sú normálne distribuované. Gaussov proces využíva vlastnosti zdedené z normálneho rozdelenia, a preto sú užitočné pri štatistickom modelovaní. Algoritmus strojového učenia, ktorý zahŕňa túto metódu jadra, využíva mieru lenivého učenia a podobnosť medzi bodmi na predpovedanie hodnoty neviditeľných bodov z tréningových údajov. Táto predpoveď nie je len odhadom, ale aj neistotou v tomto bode.

4. Kanonická korelačná analýza

Kanonická korelačná analýza je spôsob, ako odvodiť informácie z matíc krížovej kovariancie. Je tiež známa ako analýza kanonických variácií. Predpokladajme, že máme dva vektory X, Y náhodnej premennej, povedzme dva vektory X = (X1, …, Xn) a vektor Y = (Y1, …, Ym) a premennú s koreláciou, potom CCA vypočíta lineárnu kombináciu X a Y, ktoré majú medzi sebou maximálnu koreláciu.

5. Spektrálne klastrovanie

Pri použití segmentácie obrázkov je spektrálne zoskupovanie známe ako kategorizácia objektov založená na segmentácii. V spektrálnom zoskupení sa redukcia rozmerov vykonáva pred zoskupovaním do menšej dimenzie, a to pomocou vlastného čísla matice podobnosti údajov. Má svoje korene v teórii grafov, kde sa tento prístup používa na identifikáciu spoločenstiev uzlov v grafe, ktorý je založený na hranách, ktoré ich spájajú. Táto metóda je dostatočne flexibilná a umožňuje nám zoskupovať údaje aj z grafov.

6. Adaptívny filter

Adaptívny filter používa lineárny filter, ktorý obsahuje prenosovú funkciu, ktorá je riadená premenlivými parametrami a metódami, ktoré sa použijú na vyladenie týchto parametrov podľa optimalizačného algoritmu. Zložitosť tohto optimalizačného algoritmu je dôvodom, že všetok prispôsobivý filter je digitálny filter. Adaptívny filter je potrebný v tých aplikáciách, kde neexistujú vopred informácie o požadovanej operácii spracovania vopred alebo sa menia.

Nákladová funkcia sa používa v adaptívnom filtri s uzavretou slučkou, pretože je to nevyhnutné pre optimálny výkon filtra. Určuje, ako upraviť funkciu prenosu filtra, aby sa znížili náklady na ďalšiu iteráciu. Jednou z najbežnejších funkcií je stredná štvorcová chyba chybového signálu.

7. Kernel Perceptron

V strojovom učení je jadro perceptrónu typom populárneho algoritmu učenia sa perceptrónu, ktorý sa môže učiť jadrovým strojom, ako sú nelineárne klasifikátory, ktoré používajú funkciu jadra na výpočet podobnosti tých vzoriek, ktoré nie sú viditeľné s výcvikovými vzorkami. Tento algoritmus bol vynájdený v roku 1964 a stal sa tak prvým študentom klasifikácie jadra.

Väčšina diskutovaných algoritmov jadra je založená na konvexnej optimalizácii alebo vlastných problémoch a je štatisticky podložená. Ich štatistické vlastnosti sa analyzujú pomocou štatistickej teórie učenia.

Keď už hovoríme o oblastiach aplikácie metód jadra, je to rozmanité a zahŕňa geostatistiku, kriging, váženie s inverznou vzdialenosťou, 3D rekonštrukciu, bioinformatiku, chemoinformatiku, extrakciu informácií a rozpoznávanie rukou písaného textu.

záver

Zhrnil som niektoré terminológie a typy metód jadra v strojovom učení. Z dôvodu nedostatku miesta je tento článok v žiadnom prípade komplexný a slúži iba na to, aby vám poskytol informácie o tom, čo je metóda jadra, a krátke zhrnutie ich typov. Po pokrytí tohto článku vás však urobím prvý krok v oblasti strojového učenia.

Odporúčané články

Toto je sprievodca metódou jadra v strojovom vzdelávaní. Tu diskutujeme o 7 typoch metód jadra v strojovom učení. Môžete sa tiež pozrieť na nasledujúci článok.

  1. Monolitické jadro
  2. Klastrovanie v strojovom učení
  3. Data Science Machine Learning
  4. Strojové učenie bez dozoru
  5. Filtre PHP Ako overiť vstup používateľa pomocou rôznych filtrov?
  6. Kompletný sprievodca životným cyklom strojového učenia

Kategórie: