Úvod do polynomiálnej regresie

Regresia je definovaná ako metóda na nájdenie vzťahu medzi nezávislými a závislými premennými na predpovedanie výsledku. Prvý model polynómovej regresie použil Gergonne v roku 1815. Používa sa na nájdenie najvhodnejšej línie pomocou regresnej priamky na predpovedanie výsledkov. Existuje mnoho druhov regresných techník, polynomická regresia je jednou z nich. Predtým, ako tomu rozumiete, je vhodné mať náležitú znalosť lineárnej regresie, takže bude ľahké rozlíšiť rozdiely medzi nimi.

Prečo polynomiálna regresia?

  • Toto je jedna z regresných techník, ktorú používajú odborníci na predpovedanie výsledku. Definuje sa ako vzťah medzi nezávislými a závislými premennými, keď závislá premenná súvisí s nezávislou premennou majúcou n-tý stupeň. Nevyžaduje, aby bol vzťah medzi závislými a nezávislými premennými lineárny, takže ak je čiarou krivka, môže mať akýkoľvek polynómový člen.
  • Hlavný rozdiel medzi lineárnou a polynómovou regresiou spočíva v tom, že lineárna regresia vyžaduje, aby závislé a nezávislé premenné boli lineárne spojené, zatiaľ čo by to mohlo lepšie vyhovovať priamke, ak do rovnice zahrneme akýkoľvek vyšší stupeň do nezávislého premenlivého pojmu. Rovnicu polynómovej regresie s n-tým stupňom možno písať ako:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Ak pridáme vyššie stupne, ako je kvadratický, potom zmení čiaru na krivku, ktorá lepšie vyhovuje údajom. Všeobecne sa používa, keď sú body v súbore údajov rozptýlené a lineárny model nie je schopný jasne opísať výsledok. Vždy by sme mali dávať pozor na overfitting a underfitting, pričom prihliadame na tieto stupne k rovnici.
  • Je lepšie vziať do úvahy stupeň, ktorý prechádza všetkými údajovými bodmi, ale niekedy môže mať vyšší stupeň, napríklad 10 alebo 20, prechod cez všetky dátové body a znížiť chybu, ale tiež zachytáva šum údajov, ktoré prevyšujú model, a tomu sa dá vyhnúť pridaním ďalších vzoriek do súboru údajov o školeniach. Preto je vždy vhodné zvoliť optimálny stupeň, ktorý vyhovuje modelu.

Pri rozhodovaní o stupni rovnice sa používajú dve techniky:

  • Forward Selection: Ide o metódu zvýšenia stupňa, až kým nie je dostatočne definovaná na definovanie modelu.
  • Spätný výber: Je to metóda znižovania stupňa, kým nie je natoľko významný, aby definoval model.

Postup pri použití polynómovej regresie

Nižšie nájdete kroky alebo postup na použitie polynómovej regresie na akýkoľvek súbor údajov:

Krok 1: Importujte príslušný súbor údajov na akúkoľvek platformu (R alebo Python) a nainštalujte požadované balíčky potrebné na aplikáciu modelu.

Krok 2: Rozdeľte množinu údajov do výcvikových a testovacích súborov, aby sme mohli algoritmus použiť na súbor tréningových údajov a otestovať ho pomocou súboru testovacích údajov.

Krok 3: Použite metódy analýzy prieskumných údajov na štúdium pozadia údajov, ako je priemer, medián, režim, prvý kvartil, druhý kvartil atď.

Krok 4: Použite algoritmus lineárnej regresie na množinu údajov a študujte model.

Krok 5: Použite algoritmus polynómovej regresie na množinu údajov a študujte model na porovnanie výsledkov buď RMSE alebo štvorca R medzi lineárnou regresiou a polynómovou regresiou.

Krok 6: Vizualizujte a predpovedajte výsledky lineárnej aj polynomickej regresie a identifikujte, ktorý model predpovedá množinu údajov s lepšími výsledkami.

Použitie polynómovej regresie

  • Používa sa v mnohých experimentálnych postupoch na dosiahnutie výsledku pomocou tejto rovnice.
  • Poskytuje dobre definovaný vzťah medzi nezávislými a závislými premennými.
  • Používa sa na štúdium izotopov sedimentov.
  • Používa sa na štúdium výskytu rôznych chorôb v akejkoľvek populácii.
  • Používa sa na štúdium generovania akejkoľvek syntézy.

Vlastnosti polynomickej regresie

  • Je to druh nelineárnej regresnej metódy, ktorá hovorí o vzťahu medzi nezávislou a závislou premennou, keď závislá premenná súvisí s nezávislou premennou n-tého stupňa.
  • Najvýhodnejšia čiara je určená stupňom polynomickej regresnej rovnice.
  • Model odvodený z polynomickej regresie je ovplyvňovaný odľahlými hodnotami, takže je vždy lepšie zaobchádzať s odľahlými hodnotami pred použitím algoritmu na množinu údajov.
  • Funkcia Polynomialfeature () sa prevedie na maticu v závislosti od stupňa rovnice.
  • Povahu krivky je možné študovať alebo vizualizovať pomocou jednoduchého rozptylového grafu, ktorý vám poskytne lepšiu predstavu o vzťahu linearity medzi premennými a podľa toho sa rozhodne.

záver

Polynomická regresia sa používa v mnohých organizáciách, keď identifikujú nelineárny vzťah medzi nezávislými a závislými premennými. Je to jedna z ťažkých regresných techník v porovnaní s inými regresnými metódami, takže hĺbkové znalosti o prístupe a algoritme vám pomôžu dosiahnuť lepšie výsledky.

Odporúčané články

Toto je sprievodca polynomickou regresiou. Tu diskutujeme o vlastnostiach a použití polynomickej regresie. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Algoritmus SVM
  2. Metódy jadra
  3. LINEST Excel Funkcia
  4. Algoritmy strojového učenia
  5. Lineárna regresia vs logistická regresia Hlavné rozdiely

Kategórie: