Úvod do jadrových metód

Jadrá alebo metódy jadra (nazývané aj funkcie jadra) sú množiny rôznych typov algoritmov, ktoré sa používajú na analýzu vzorov. Používajú sa na riešenie nelineárneho problému pomocou lineárneho klasifikátora. Metódy jadier sa používajú v SVM (Support Vector Machines), ktoré sa používajú pri problémoch klasifikácie a regresie. SVM používa to, čo sa nazýva Kernel Trick, kde sa dáta transformujú a pre možné výstupy sa nájde optimálna hranica.

Potreba metódy jadra a jej fungovanie

Predtým, ako sa dostaneme do práce s jadrovými metódami, je dôležitejšie pochopiť podporné vektorové stroje alebo SVM, pretože jadrá sú implementované do modelov SVM. Podporné vektorové stroje sú teda pod dohľadom algoritmov strojového učenia, ktoré sa používajú pri problémoch klasifikácie a regresie, ako je klasifikácia jabĺk na triedu ovocia a klasifikácia leva na zviera triedy.

Na demonštráciu nižšie je uvedené, ako vyzerajú podporné vektorové stroje:

Tu vidíme hyperplán, ktorý oddeľuje zelené bodky od modrých. Hyperplán je o jeden rozmer menší ako okolitá rovina. Napríklad na obrázku vyššie máme 2 dimenziu, ktorá predstavuje okolitý priestor, ale osamelý priestor, ktorý rozdeľuje alebo klasifikuje priestor, je o jeden rozmer menší ako okolitý priestor a nazýva sa hyperplane.

Ale čo keď budeme mať takéto vstupy:

Je veľmi ťažké vyriešiť túto klasifikáciu pomocou lineárneho klasifikátora, pretože neexistuje žiadna dobrá lineárna čiara, ktorá by mala byť schopná klasifikovať červené a zelené bodky, pretože body sú náhodne rozdelené. Tu prichádza použitie funkcie jadra, ktorá ukazuje body do vyšších dimenzií, rieši problém tam a vracia výstup. Premýšľajte o tom týmto spôsobom, vidíme, že zelené bodky sú uzavreté v niektorej obvodovej oblasti, zatiaľ čo červená leží mimo nej, podobne by mohli existovať aj iné scenáre, v ktorých by sa zelené bodky mohli distribuovať v oblasti lichobežníka.

Čo robíme, je preto previesť dvojrozmernú rovinu, ktorá bola najprv klasifikovaná jednorozmerným hyperrozmerom („alebo priamou čiarou“), na trojrozmernú oblasť, a tu náš klasifikátor, tj hyperrolan, nebude priamkou, ale dvojrozmerným. - rozmerná rovina, ktorá bude rezať oblasť.

Aby sme získali matematické pochopenie jadra, pochopme Lili Jiangovu rovnicu jadra, ktorá je:

K (x, y) = kde,
K je funkcia jadra,
X a Y sú rozmerové vstupy,
f je mapa z n-rozmerného do m-rozmerného priestoru a
je bodový produkt.

Ilustrácia pomocou príkladu.

Povedzme, že máme dva body, x = (2, 3, 4) a y = (3, 4, 5)

Ako sme videli, K (x, y) =.

Poďme najprv vypočítať

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
áno,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) a
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
takže bodkový produkt,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 + 144 + 240 + 120 + 240 + 400) =
1444
a
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Ako zistíme, f (x) .f (y) a K (x, y) nám poskytnú rovnaký výsledok, ale predchádzajúca metóda vyžadovala veľa výpočtov (kvôli premietaniu 3 rozmerov do 9 rozmerov) pri použití jadro, bolo to omnoho jednoduchšie.

Druhy jadra a metódy v SVM

Pozrime sa na niektoré funkcie jadra alebo typy, ktoré sa používajú v SVM:

1. Linerove jadro - povedzme, že máme dva vektory s názvom x1 a Y1, potom je lineárne jadro definované bodovým produktom týchto dvoch vektorov:

K (x1, x2) = x1. x2

2. Polynomiálne jadro - Polynomické jadro je definované touto rovnicou:

K (x1, x2) = (x1. X2 + 1) d,

Kde,

d je stupeň polynómu a x1 a x2 sú vektory

3. Gaussovo jadro - Toto jadro je príkladom jadra s radiálnou základnou funkciou. Táto rovnica je uvedená nižšie:

Daná sigma hrá veľmi dôležitú úlohu pri výkone gaussovského jadra a nemala by sa podceňovať ani podceňovať, mala by sa podľa problému starostlivo vyladiť.

4. Exponenciálne jadro - Toto je v úzkom vzťahu s predchádzajúcim jadrom, tj Gaussovským jadrom, s jediným rozdielom je - štvorec normy je odstránený.

Funkcia exponenciálnej funkcie je:


Toto je tiež funkcia jadra radiálneho základu.

5. Laplacianské jadro - Tento typ jadra je menej náchylný na zmeny a je úplne rovnocenný s predtým diskutovaným jadrom exponenciálnej funkcie, rovnica Laplacianovho jadra sa uvádza ako:

6. Hyperbolické alebo sigmoidné jadro - Toto jadro sa používa v neurónových sieťových oblastiach strojového učenia. Aktivačná funkcia sigmoidného jadra je bipolárna sigmoidná funkcia. Rovnica pre funkciu hyperbolického jadra je:

Toto jadro je veľmi používané a populárne medzi podpornými vektorovými strojmi.

7. Jadro Anova radiálneho základu - Je známe, že toto jadro funguje veľmi dobre pri problémoch s viacrozmernou regresiou rovnako ako gaussovské a laplaciánske jadro. Toto tiež patrí do kategórie jadra s radiálnymi bázami.

Rovnica pre jadro Anova je:

Existuje omnoho viac typov jadrových metód a diskutovali sme o najpoužívanejších jadrách. Závisí to výlučne od typu problému, ktorý rozhodne o použití jadra.

záver

V tejto časti sme videli definíciu jadra a ako to funguje. Pokúsili sme sa pomocou diagramov vysvetliť fungovanie jadier. Potom sme sa pokúsili dať jednoduchú ilustráciu pomocou matematiky o funkcii jadra. V záverečnej časti sme videli rôzne typy funkcií jadra, ktoré sa dnes bežne používajú.

Odporúčané články

Toto je sprievodca jadrovými metódami. Tu diskutujeme úvod, potrebu, fungovanie a typy metód jadra s príslušnou rovnicou. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Algoritmy dolovania údajov
  2. K- znamená algoritmus zoskupovania
  3. Algoritmus hrubej sily
  4. Algoritmus rozhodovacieho stromu
  5. Metódy jadra v strojovom učení
  6. Rozhodovací strom v strojovom učení

Kategórie: