Úvod do viacrozmernej regresie
- Výraz v multivariate znamená model s viac ako jednou premennou
- Viacrozmerná regresia je súčasťou viacrozmerných štatistík.
- Viacrozmerná regresia je technika používaná na odhad jediného regresného modelu, keď existuje viac ako jedna výsledná premenná.
- Viacrozmerná regresia bežne používa algoritmus strojového učenia, ktorý je algoritmom supervízovaného učenia.
Prečo jeden regresný model nebude fungovať?
- Ako je známe, regresná analýza sa používa hlavne na skúmanie vzťahu medzi závislou a nezávislou premennou.
- V skutočnom svete existuje veľa situácií, keď mnoho nezávislých premenných má vplyv na iné premenné, preto musíme prejsť na iné možnosti ako jediný regresný model, ktorý dokáže zobrať iba jednu nezávislú premennú.
Čo je to viacrozmerná regresia?
- Viacrozmerná regresia pomáha pri meraní uhla viac ako jednej nezávislej premennej a viac ako jednej závislej premennej. Zistí vzťah medzi premennými (lineárne súvisiaci).
- Používa sa na predpovedanie správania výslednej premennej a priradenia predikčných premenných a toho, ako sa menia predikčné premenné.
- Môže sa uplatniť v mnohých praktických oblastiach, ako je politika, ekonómia, medicína, výskumné práce a mnoho rôznych druhov podnikov.
- Viacrozmerná regresia je jednoduché rozšírenie viacnásobnej regresie.
- Viacnásobná regresia sa používa na predpovedanie a výmenu hodnôt jednej premennej založenej na súhrnnej hodnote viac ako jednej hodnoty prediktorových premenných.
- Najprv si ukážeme príklad, ako porozumieť použitiu viacrozmernej regresie a potom hľadáme riešenie tejto otázky.
Príklady viacrozmernej regresie
- Ak spoločnosť E-commerce Company zhromažďuje údaje o svojich zákazníkoch, ako je vek, kúpna história zákazníka, pohlavie a spoločnosť, chce nájsť vzťah medzi týmito rôznymi závislými osobami a nezávislými premennými.
- Tréner v telocvični zhromaždil údaje o jeho klientovi, ktoré prichádzajú do jeho telocvične a chcú pozorovať niektoré veci klienta, ktoré sú zdravie, stravovacie návyky (aký druh produktového klienta konzumuje každý týždeň), hmotnosť klienta. To chce nájsť vzťah medzi týmito premennými.
Ako ste videli vo vyššie uvedených dvoch príkladoch, že v oboch situáciách existuje viac ako jedna premenná, niektoré sú závislé a niektoré sú nezávislé, takže jediná regresia nestačí na analýzu tohto druhu údajov.
Na obrázku je viacrozmerná regresia.
1. Výber funkcie -
Výber funkcií hrá najdôležitejšiu úlohu pri viacrozmernej regresii.
Nájdenie funkcie, ktorá je potrebná na nájdenie premennej, ktorá je na tejto funkcii závislá.
2. Normalizácia funkcií -
Pre lepšiu analýzu je potrebné škálovať vlastnosti tak, aby sa dostali do špecifického rozsahu. Môžeme tiež zmeniť hodnotu každej funkcie.
3. Vyberte funkciu Strata a Hypotéza -
Stratová funkcia vypočíta stratu, keď hypotéza predpovedá nesprávnu hodnotu.
Hypotéza znamená predpovedanú hodnotu z premennej funkcie.
4. Nastavte parametre hypotéz -
Nastavte parameter hypotézy, ktorý môže znížiť stratu a predpovedať.
5. Minimalizujte stratu -
Minimalizácia straty pomocou algoritmu minimalizácie straty a použiť ju v množine údajov, ktorá môže pomôcť upraviť parametre hypotézy. Akonáhle je strata minimalizovaná, môže byť použitá na predikciu.
Existuje mnoho algoritmov, ktoré sa môžu použiť na zníženie strát, ako je napríklad zostup.
6. Otestujte funkciu hypotéz -
Skontrolujte funkciu hypotézy, ako opravuje predpovedajúce hodnoty, otestujte ju na testovacích údajoch.
Kroky na sledovanie archívu Viacrozmerná regresia
1) Importujte potrebné spoločné knižnice, napríklad numpy, pandy
2) Čítajte súbor údajov pomocou knižnice pandov
3) Ako sme už diskutovali, musíme údaje normalizovať, aby sme dosiahli lepšie výsledky. Prečo normalizácia, pretože každá funkcia má iný rozsah hodnôt.
4) Vytvorte model, ktorý dokáže archivovať regresiu, ak používate lineárnu regresnú rovnicu
Y = mx + c
V ktorom je x daný vstup, m je šikmá čiara, c je konštantná, y je výstupná premenná.
5) Trénujte model pomocou hyperparametra. Pochopte hyperparameter nastavený podľa modelu. Napríklad rýchlosť učenia, epochy, iterácie.
6) Ako je uvedené vyššie, ako hrá hypotéza dôležitú úlohu v analýze, overuje hypotézu a meria funkciu straty / nákladov.
7) Funkcia straty / nákladov nám pomôže zmerať, ako je hodnota hypotéz pravdivá a presná.
8) Minimalizácia funkcie strata / náklady pomôže modelu zlepšiť predpoveď.
9) Stratovú rovnicu je možné definovať ako súčet štvorcového rozdielu medzi predpokladanou hodnotou a skutočnou hodnotou vydelenou dvojnásobkom veľkosti súboru údajov.
10) Aby sa minimalizovala strata / náklady pomocou gradientu klesania, začína náhodnou hodnotou a nájde bod, v ktorom je ich strata najmenšia.
Podľa vyššie uvedeného môžeme implementovať viacrozmernú regresiu
Výhody viacrozmernej regresie
- Technika viacerých premenných umožňuje nájsť vzťah medzi premennými alebo znakmi
- Pomáha nájsť koreláciu medzi nezávislými a závislými premennými.
Výhody multivariačnej regresie
- Viacrozmerné techniky sú trochu zložitý a matematický výpočet na vysokej úrovni
- Výstup modelu viacrozmernej regresie nie je ľahko interpretovateľný a niekedy preto, že niektoré straty a chyby nie sú identické.
- Nemožno ju použiť na malý súbor údajov, pretože výsledky sú jednoduchšie vo väčších súboroch údajov.
Záver - Viacrozmerná regresia
- Hlavným účelom použitia viacrozmernej regresie je, keď máte k dispozícii viac ako jednu premennú av takom prípade nebude fungovať jedna lineárna regresia.
- Hlavne reálny svet má viac premenných alebo funkcií, keď sa do hry vstúpi viacero premenných / funkcií, používa sa viacrozmerná regresia.
Odporúčané články
Toto je príručka pre viacrozmernú regresiu. Tu diskutujeme Úvod, Príklady multivariačnej regresie spolu s výhodami a nevýhodami. Viac informácií nájdete aj v ďalších navrhovaných článkoch -
- Regresná formule
- Kurz Data Science v Londýne
- Prevádzkovatelia SAS
- Techniky vedy o údajoch
- Premenné v JavaScripte
- Hlavné rozdiely regresie v porovnaní s klasifikáciou