Úvod do polynomiálnej regresie
Regresia je definovaná ako metóda na nájdenie vzťahu medzi nezávislými a závislými premennými na predpovedanie výsledku. Prvý model polynómovej regresie použil Gergonne v roku 1815. Používa sa na nájdenie najvhodnejšej línie pomocou regresnej priamky na predpovedanie výsledkov. Existuje mnoho druhov regresných techník, polynomická regresia je jednou z nich. Predtým, ako tomu rozumiete, je vhodné mať náležitú znalosť lineárnej regresie, takže bude ľahké rozlíšiť rozdiely medzi nimi.
Prečo polynomiálna regresia?
- Toto je jedna z regresných techník, ktorú používajú odborníci na predpovedanie výsledku. Definuje sa ako vzťah medzi nezávislými a závislými premennými, keď závislá premenná súvisí s nezávislou premennou majúcou n-tý stupeň. Nevyžaduje, aby bol vzťah medzi závislými a nezávislými premennými lineárny, takže ak je čiarou krivka, môže mať akýkoľvek polynómový člen.
- Hlavný rozdiel medzi lineárnou a polynómovou regresiou spočíva v tom, že lineárna regresia vyžaduje, aby závislé a nezávislé premenné boli lineárne spojené, zatiaľ čo by to mohlo lepšie vyhovovať priamke, ak do rovnice zahrneme akýkoľvek vyšší stupeň do nezávislého premenlivého pojmu. Rovnicu polynómovej regresie s n-tým stupňom možno písať ako:
Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n
- Ak pridáme vyššie stupne, ako je kvadratický, potom zmení čiaru na krivku, ktorá lepšie vyhovuje údajom. Všeobecne sa používa, keď sú body v súbore údajov rozptýlené a lineárny model nie je schopný jasne opísať výsledok. Vždy by sme mali dávať pozor na overfitting a underfitting, pričom prihliadame na tieto stupne k rovnici.
- Je lepšie vziať do úvahy stupeň, ktorý prechádza všetkými údajovými bodmi, ale niekedy môže mať vyšší stupeň, napríklad 10 alebo 20, prechod cez všetky dátové body a znížiť chybu, ale tiež zachytáva šum údajov, ktoré prevyšujú model, a tomu sa dá vyhnúť pridaním ďalších vzoriek do súboru údajov o školeniach. Preto je vždy vhodné zvoliť optimálny stupeň, ktorý vyhovuje modelu.
Pri rozhodovaní o stupni rovnice sa používajú dve techniky:
- Forward Selection: Ide o metódu zvýšenia stupňa, až kým nie je dostatočne definovaná na definovanie modelu.
- Spätný výber: Je to metóda znižovania stupňa, kým nie je natoľko významný, aby definoval model.
Postup pri použití polynómovej regresie
Nižšie nájdete kroky alebo postup na použitie polynómovej regresie na akýkoľvek súbor údajov:
Krok 1: Importujte príslušný súbor údajov na akúkoľvek platformu (R alebo Python) a nainštalujte požadované balíčky potrebné na aplikáciu modelu.
Krok 2: Rozdeľte množinu údajov do výcvikových a testovacích súborov, aby sme mohli algoritmus použiť na súbor tréningových údajov a otestovať ho pomocou súboru testovacích údajov.
Krok 3: Použite metódy analýzy prieskumných údajov na štúdium pozadia údajov, ako je priemer, medián, režim, prvý kvartil, druhý kvartil atď.
Krok 4: Použite algoritmus lineárnej regresie na množinu údajov a študujte model.
Krok 5: Použite algoritmus polynómovej regresie na množinu údajov a študujte model na porovnanie výsledkov buď RMSE alebo štvorca R medzi lineárnou regresiou a polynómovou regresiou.
Krok 6: Vizualizujte a predpovedajte výsledky lineárnej aj polynomickej regresie a identifikujte, ktorý model predpovedá množinu údajov s lepšími výsledkami.
Použitie polynómovej regresie
- Používa sa v mnohých experimentálnych postupoch na dosiahnutie výsledku pomocou tejto rovnice.
- Poskytuje dobre definovaný vzťah medzi nezávislými a závislými premennými.
- Používa sa na štúdium izotopov sedimentov.
- Používa sa na štúdium výskytu rôznych chorôb v akejkoľvek populácii.
- Používa sa na štúdium generovania akejkoľvek syntézy.
Vlastnosti polynomickej regresie
- Je to druh nelineárnej regresnej metódy, ktorá hovorí o vzťahu medzi nezávislou a závislou premennou, keď závislá premenná súvisí s nezávislou premennou n-tého stupňa.
- Najvýhodnejšia čiara je určená stupňom polynomickej regresnej rovnice.
- Model odvodený z polynomickej regresie je ovplyvňovaný odľahlými hodnotami, takže je vždy lepšie zaobchádzať s odľahlými hodnotami pred použitím algoritmu na množinu údajov.
- Funkcia Polynomialfeature () sa prevedie na maticu v závislosti od stupňa rovnice.
- Povahu krivky je možné študovať alebo vizualizovať pomocou jednoduchého rozptylového grafu, ktorý vám poskytne lepšiu predstavu o vzťahu linearity medzi premennými a podľa toho sa rozhodne.
záver
Polynomická regresia sa používa v mnohých organizáciách, keď identifikujú nelineárny vzťah medzi nezávislými a závislými premennými. Je to jedna z ťažkých regresných techník v porovnaní s inými regresnými metódami, takže hĺbkové znalosti o prístupe a algoritme vám pomôžu dosiahnuť lepšie výsledky.
Odporúčané články
Toto je sprievodca polynomickou regresiou. Tu diskutujeme o vlastnostiach a použití polynomickej regresie. Viac informácií nájdete aj v ďalších navrhovaných článkoch -
- Algoritmus SVM
- Metódy jadra
- LINEST Excel Funkcia
- Algoritmy strojového učenia
- Lineárna regresia vs logistická regresia Hlavné rozdiely