Prehľad náhodného lesného algoritmu

Algoritmy sú súbor krokov, ktoré sa používajú na vykonanie zložitého výpočtu na vyriešenie problémov. Algoritmy sa vytvárajú na riešenie problémov strojového učenia. Algoritmus náhodného lesa je jedným takým algoritmom, ktorý sa používa na strojové učenie. Používa sa na školenie údajov na základe predtým kŕmených údajov a na predpovedanie možného výsledku pre budúcnosť. Je to veľmi populárny a výkonný algoritmus strojového učenia.

Pochopenie algoritmu náhodného lesa

Algoritmus náhodných lesov je založený na učení pod dohľadom. Môže sa použiť na regresné aj klasifikačné problémy. Ako už názov napovedá, na náhodné lesy sa dá pozerať ako na súbor algoritmov viacerých rozhodovacích stromov s náhodným výberom vzoriek. Tento algoritmus je určený na odstránenie nedostatkov algoritmu stromu rozhodovania.

Náhodný les je kombináciou Breimanovho nápadu „bagging“ a náhodného výberu funkcií. Cieľom je spresniť predpoveď tak, že sa zmeria priemer alebo spôsob výstupu viacerých rozhodovacích stromov. Čím väčší je počet rozhodovacích stromov, tým presnejší bude výstup.

Spracovanie náhodného lesa:

Aby sme pochopili fungovanie náhodného lesa, musíme najprv pochopiť fungovanie stromov rozhodovania, pretože náhodný les je založený na stromoch rozhodovania.

Strom rozhodnutí -

Je to jednoduchý, ale populárny algoritmus, ktorý sleduje prístup zhora nadol. Každý uzol v rozhodovacom strome predstavuje atribút a list predstavuje výsledok. Vetvy, ktoré spájajú uzly s listami, sú rozhodnutia alebo pravidlá predikcie. Koreňový uzol je atribút, ktorý najlepšie popisuje súbor údajov o školení. Celý proces je teda znázornený do stromovej štruktúry.

Obmedzenia rozhodovacieho stromu: Má tendenciu nadmerne zapadať do súboru údajov o školení. Preto pri použití testu alebo rôznych výsledkov súboru údajov sa môžu líšiť. Vedie to k zlým rozhodnutiam. Stromy môžu byť nestabilné, pretože mierna zmena údajov môže viesť k úplne inému stromu.

Náhodný les využíva metódu vrecovania na dosiahnutie požadovaného výsledku. Koncept spočíva v použití algoritmu rozhodovacieho stromu na množine údajov, ale zakaždým s rôznymi vzorkami údajov o školení. Výstup z týchto rozhodovacích stromov sa bude líšiť a môže byť skreslený na základe údajov o školení vložených do algoritmu. Takže konečný výstup sa môže brať ako priemer alebo režim výstupu jednotlivého rozhodovacieho stromu. Preto môže byť rozptyl znížený. Odber vzoriek sa môže vykonať s výmenou. Výstupy rozhodovacích stromov sú zoradené a ten, ktorý má najvyššie hodnotenie, bude konečným výstupom Random Forest. Získaný výstup bude teda menej skreslený a stabilnejší.

Dôležitosť náhodného lesného algoritmu:

  • Algoritmus náhodného lesa sa môže použiť pre regresné aj klasifikačné modely strojového učenia.
  • Môže tiež spracovať chýbajúce hodnoty v množine údajov.
  • Na rozdiel od stromu rozhodovania neprepĺňa model a dá sa použiť aj pre kategorické premenné. Náhodný les dodáva modelu náhodnosť.
  • Na rozdiel od rozhodovacích stromov, namiesto hľadania jednej najdôležitejšej funkcie na vytvorenie rozhodovacieho stromu okolo, vyhľadáva najlepšiu funkciu pomocou náhodnej podmnožiny prvkov pre stromy.
  • A potom vygenerujte výstup na základe najlepšie hodnoteného výstupu stromov rozhodovacích podskupín.

Skutočný život Príklad

Predpokladajme, že dievča menom Lisa chce založiť knihu, a tak šla k jednému zo svojich priateľov Davidovi a požiadala ho o jeho návrh. Navrhla Lisovi knihu založenú na spisovatelke, ktorú čítala. Podobne išla na niekoľko ďalších priateľov za svoje návrhy a na základe žánru, autora a vydavateľa navrhla niektoré knihy. Z toho urobila zoznam. Potom si kúpila knihu, ktorú navrhla väčšina jej priateľov.

Predpokladajme, že jej priatelia sú stromom rozhodovania a žánrom, autorom, vydavateľom atď., Ktoré sú vlastnosťami údajov. Preto Lisa, ktorá ide k rôznym priateľom, predstavuje reprezentáciu rôznych rozhodovacích stromov. Výstupom algoritmu je preto kniha, ktorá získala väčšinu hlasov.

Aplikácie náhodného lesného algoritmu:

  • Algoritmus náhodného lesníctva sa používa v mnohých oblastiach, ako je bankovníctvo, elektronický obchod, medicína, akciový trh atď.
  • V bankovníctve sa používa na zisťovanie lojálnych zákazníkov a podvodníkov. Používa sa na zistenie, ktorý zákazník bude schopný splácať úver. Pretože v bankovníctve je veľmi dôležité poskytovať pôžičky iba tým zákazníkom, ktorí ich budú schopní včas splácať. Na odhad, či je zákazník podvodný alebo nie, sa používa aj náhodný les. Rast banky závisí od tohto typu predikcie.
  • V oblasti medicíny sa náhodný les používa na diagnostikovanie choroby na základe pacientov z minulých lekárskych záznamov.
  • Na akciovom trhu sa náhodný les používa na identifikáciu trhového a skladového správania.
  • V oblasti elektronického obchodu sa tento algoritmus používa na predpovedanie preferencií zákazníka na základe minulého správania.

výhoda:

  • Ako bolo uvedené vyššie, algoritmus náhodných doménových štruktúr sa môže použiť na regresnú aj klasifikačnú úlohu. Ľahko sa používa. Overfitting súboru údajov nie je problémom v algoritme náhodných doménových štruktúr.
  • Môže sa použiť na identifikáciu najdôležitejšej funkcie spomedzi dostupných funkcií. Pri použití hyperparametra sa často vytvárajú dobré predpovede a je veľmi ľahké porozumieť.
  • Náhodný les má vysokú presnosť, flexibilitu a menšie rozptyly.

nevýhoda:

  • S rastúcim počtom stromov sa algoritmus stáva pomalým a neúčinným pri spracovaní scenárov v reálnom čase.
  • Náhodný les je v porovnaní so stromom rozhodovania časovo náročný.
  • Vyžaduje si tiež viac zdrojov na výpočet.

Príklady: Spoločnosti používajú algoritmy strojového učenia, aby lepšie porozumeli svojim zákazníkom a rozvíjali svoje podnikanie. Algoritmus náhodných doménových štruktúr sa dá použiť na pochopenie preferencie zákazníka. Môže sa tiež použiť na predpovedanie pravdepodobnosti, že osoba kupuje určitý produkt. Predpokladajme, že vzhľadom na vlastnosti, ako je hmotnosť, výška, farba, priemer, spotreba paliva atď., Spoločnosť môže predpovedať, či bude alebo nebude úspešným produktom na trhu. Môže sa použiť na identifikáciu faktorov zodpovedných za vysoký predaj.

záver:

Algoritmus náhodných domén je jednoduchý na používanie a efektívny algoritmus. Môže to predpovedať s vysokou presnosťou, a preto je veľmi populárny.

Odporúčané články

Toto bol sprievodca náhodným lesným algoritmom. Tu diskutujeme fungovanie, porozumenie, dôležitosť, aplikáciu, výhody a nevýhody náhodného lesného algoritmu. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je to algoritmus?
  2. Algoritmus Naive Bayes
  3. Čo je to chamtivý algoritmus?
  4. Čo je to dátové jazero?
  5. Najpoužívanejšie techniky ensemble learningu

Kategórie: