ANOVA (Analýza variácie)

ANOVA je skratka pre Analysis of Variance. ANOVA založil Ronald Fisher v roku 1918. Názov Analysis Of Variance bol odvodený na základe prístupu, v ktorom táto metóda používa rozptyl na určenie prostriedkov, či sú rôzne alebo rovnaké.

Je to štatistická metóda používaná na testovanie rozdielov medzi dvoma alebo viacerými spôsobmi. Používa sa skôr na testovanie všeobecných rozdielov ako špecifických rozdielov medzi prostriedkami. Hodnotí význam jedného alebo viacerých faktorov porovnaním priemerov odozvy na rôzne úrovne faktorov.

Nulová hypotéza hovorí, že všetky prostriedky obyvateľstva sú si rovné. Alternatívna hypotéza dokazuje, že priemer najmenej jednej populácie je iný

Poskytuje spôsob, ako otestovať rôzne nulové hypotézy súčasne.

Všeobecný účel ANOVA

Dôvodom vykonávania ANOVA je zistiť, či medzi skupinami existuje nejaký rozdiel v nejakej premennej. Vedci dnes používajú ANOVA mnohými spôsobmi. Použitie ANOVA úplne závisí od návrhu výskumu.

T-test môžete použiť na porovnanie priemerov dvoch vzoriek, ale ak existujú viac ako dve vzorky, ktoré sa majú porovnať, potom je najlepšou metódou ANOVA.

Predpoklady ANOVA

Existujú štyri hlavné predpoklady

  • Očakávané hodnoty chýb sú nulové
  • Rozptyly všetkých chýb sú rovnaké
  • Chyby sú nezávislé
  • Spravidla sú distribuované

Typy ANOVA

  1. Jednosmerná cesta medzi skupinami

Jednosmerná ANOVA sa používa na kontrolu, či existuje nejaký významný rozdiel medzi prostriedkami troch alebo viacerých neprepojených skupín. Testuje hlavne nulovú hypotézu.

H₀: μ₁ = μ₂ = μ₃ = … .. = µₓ

Kde u znamená strednú skupinu a x znamená počet skupín. Jednosmerná ANOVA dáva významný výsledok. Jedným zo spôsobov ANOVA je súhrnná štatistika testu a nedá vám vedieť, ktoré konkrétne skupiny sa od seba líšili. Aby ste poznali konkrétnu skupinu alebo skupiny, ktoré sa líšili od ostatných, musíte urobiť post hoc test.

Príklad jednosmernej ANOVA

20 osôb je vybraných na testovanie účinku piatich rôznych cvičení. 20 ľudí je rozdelených do 4 skupín, z ktorých každá má 5 členov. Ich hmotnosť sa zaznamená po niekoľkých dňoch. Porovnáva sa vplyv cvičení na 5 skupín mužov. Tu je jediným faktorom hmotnosť.

predpoklady

Závislá premenná sa bežne distribuuje do každej skupiny

Existujú homogénne rozdiely

Nezávislosť pozorovaní

  1. Jednosmerná ANOVA opakovala opatrenia

Opakované opatrenia ANOVA sú viac-menej rovnaké ako One Way ANOVA, ale používajú sa pre zložité zoskupenia. Opakované opatrenia skúmajú 1. zmeny priemerných skóre v priebehu troch alebo viacerých časových bodov

2. rozdiely v priemernom skóre za rôznych podmienok.

Príklad opakovaných opatrení

Mohli by ste skúmať účinok šesťmesačného cvičebného programu na zníženie hmotnosti u niektorých jednotlivcov. Hmotnosť vypočítate v troch rôznych časových úsekoch počas tréningového obdobia, aby ste vyvinuli časový kurz pre akýkoľvek efekt cvičenia.

Možno by ste si mohli dopriať toho istého jednotlivca, aby jedol rôzne druhy potravín znižujúcich hmotnosť a hodnotil ich podľa chuti.

V tomto príklade sa rovnaká skupina ľudí meria viackrát na tej istej závislej premennej.

  1. Obojstranne medzi skupinami

Dvojcestná ANOVA porovnáva priemerný rozdiel medzi skupinami, ktoré boli rozdelené na dva faktory. Hlavným cieľom dvojcestnej ANOVA je zistiť, či existuje nejaká interakcia medzi dvoma nezávislými premennými na závislých premenných. Tiež vám dá vedieť, či je účinok jednej z vašich nezávislých premenných na závislú premennú rovnaký pre všetky hodnoty vašej inej nezávislej premennej.

príklad

Výskum vplyvu hnojív na úrodu ryže. Na každú parcelu, na ktorej sa pestuje ryža, nanášate päť hnojív rôznej kvality. Zaznamenáva sa výnos z každého pozemku a pozoruje sa rozdiel medzi každým pozemkom. Tu je tiež možné študovať vplyv plodnosti pozemkov. Existujú teda dva faktory, hnojivo a plodnosť.

predpoklady

Predtým, ako začnete s obojsmernou ANOVA, mali by vaše údaje prejsť šiestimi predpokladmi, aby ste sa uistili, že údaje, ktoré máte, sú dostatočné na vykonanie dvojsmernej ANOVA. Nasleduje šesť predpokladov

  • Vaša závislá premenná by sa mala merať na nepretržitej úrovni
  • Vaše dve nezávislé premenné by mali obsahovať dve alebo viac kategoricky nezávislých skupín pre každú z nich
  • Mali by ste mať nezávislosť od pozorovaní
  • Vyvarujte sa akýchkoľvek odľahlých hodnôt
  • Vaša závislá premenná by sa mala normálne distribuovať pre každú kombináciu skupín dvoch nezávislých premenných
  • Homogénnosť rozptylov
  1. Dva opakované opatrenia

Dvojnásobne opakované meranie stredných rozdielov medzi skupinami, ktoré boli rozdelené do dvoch nezávislých premenných. Vo výskume, kde sa závislá premenná meria viac ako dvakrát za dvoch alebo viacerých podmienok, sa často používa obojsmerne opakované meranie.

príklad

Výskumník v oblasti zdravia chce nájsť najlepší spôsob, ako zmierniť chronickú bolesť kĺbov, ktorú ľudia trpia. Výskumník vyberie dva rôzne typy liečby na zníženie úrovne bolesti. Dva typy liečby sú známe ako „stavy“. Liečba A je masážny program a liečba B je akupunktúrny program. Obe liečby sa podávajú všetkým pacientom počas 8 týždňov.

Pacienti sa testujú v troch časových bodoch - na začiatku programu, v strede programu a na konci programu.

Výskumník vyberie 30 pacientov, ktorí sa majú zúčastniť na výskume. Keď však prvých 15 pacientov podstúpi liečbu A, ďalších 15 pacientov podstúpi liečbu B a naopak.

Na konci 8 týždňov výskumník použil dvojnásobne opakované merania ANOVA, aby zistil, či došlo k nejakej zmene bolesti v dôsledku interakcie medzi typom liečby a v ktorom okamihu.

predpoklady

Vaše údaje by mali vyhovieť piatim predpokladom, ktoré sú potrebné pre obojsmerne opakované merania ANOVA, aby sa dosiahol presný výsledok.

  • Vaša závislá premenná by sa mala merať na nepretržitej úrovni
  • Vaše dva faktory v rámci predmetu by mali pozostávať z najmenej dvoch kategórií súvisiacich s kategorizáciou
  • Nemali by existovať žiadne odľahlé hodnoty
  • Závislá premenná by sa mala normálne rozdeliť medzi každú kombináciu súvisiacich skupín
  • Rozdiely medzi všetkými kombináciami príbuzných skupín by mali byť rovnaké

Parametrický a neparametrický test ANOVA

Ak sú informácie o populácii pomocou ich parametrov úplne známe, potom sa vykonaný štatistický test nazýva Parametrický test.

Ak nie sú známe informácie o populácii alebo parametroch, ale stále je potrebné testovať hypotézu, nazýva sa neparametrický test.

Ak máte kategorické údaje, potom nemôžete použiť metódu ANOVA, musíte použiť test Chi square, ktorý sa zaoberá interakciou ANOVA.

Postup testovania hypotéz - jednosmerná ANOVA

  1. Skontrolujte všetky potrebné predpoklady a napíšte nulové a alternatívne hypotézy

Na vykonanie jednosmernej ANOVA by mali existovať určité predpoklady. Predpoklady sú nasledujúce

  • Každá vzorka je nezávislá náhodná vzorka
  • Distribúcia premennej odozvy nasleduje normálne rozdelenie
  • Rozdiely v populácii sú rovnaké v reakciách na úrovne skupín. Dá sa to zistiť vydelením najväčšej štandardnej odchýlky vzorky najmenším štandardom vzorky a nie je väčšia ako dve, potom sa predpokladá, že rozdiely v populácii sú rovnaké.
  1. Vypočítajte príslušnú štatistiku testu

Jedným zo spôsobov ANOVA používa štatistiku testu F. Ručné výpočty vyžadujú veľa krokov na výpočet pomeru F, ale štatistický softvér, ako je SPSS, pre vás vypočíta pomer F a vytvorí zdrojovú tabuľku ANOVA.

Tabuľka ANOVA vám poskytne informácie o variabilite medzi skupinami a v rámci skupín. V tabuľke nájdete všetky vzorce. Nižšie je uvedený príklad jednosmernej tabuľky ANOVA

zdrojSSDFPANIF
ošetrenieSSTk-1SST / (k-1)MST / MSE
ChybaSSEnkSSE / (NK)
Celkom (opravené)SSN-1

SST znamená Súčet štvorcov liečby, SSE znamená Súčet štvorcov chýb

DFT, čo je k-1, znamená stupne slobody zaobchádzania, DFE, čo je Nk, znamená stupne slobody za chyby.

  1. Určite hodnotu ap spojenú so štatistikou testu
  2. Určite medzi nulovou a alternatívnou hypotézou

Ak je nulová hypotéza nepravdivá, potom by MST mala byť väčšia ako MSE

  1. Urobte záver

Na základe vášho výsledku napíšte záver k svojej anov výskumnej otázke.

Viacnásobné porovnávacie testy

Ak zistíte, že medzi skupinami existuje významný rozdiel, ktorý nesúvisí s chybou vzorkovania, je potrebné vykonať niekoľko t testov, aby sa otestovali prostriedky medzi skupinami. Vykonáva sa niekoľko testov na kontrolu chybovosti prvého typu.

  • Scheffeho test
  • Modifikovaný Bonferroniho test
  • Dunnetteov test
  • Tukeyov test

výpočty

Výpočty ANOVA sa môžu robiť tromi spôsobmi - ručnými výpočtami, hárkami Excel a softvérom SPSS. Poďme sa dozvedieť podrobnejšie o všetkých výpočtoch

  1. Ručné výpočty ANOVA

  • Krok 1

Vypočítajte CM

CM = (Celkom všetkých pozorovaní) 2 / N Celkom

  • Krok 2

Vypočítajte celkový SS

Spolu SS = súčet druhých mocnín všetkých pozorovaní - CM

  • Krok 3

Vypočítať SST (súčet štvorcov na ošetrenie)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Krok 4

Vypočítať SSE (súčet štvorcov pre chyby)

SSE = SS (celkom) - SST

  • Krok 5

Vypočítajte MST, MSE a ich pomer F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA pomocou Excelu

Ak chcete vykonať jeden faktor ANOVA vo vynikajúcej, postupujte podľa týchto jednoduchých krokov

  • Prejdite na kartu Údaje
  • Kliknite na položku Analýza údajov
  • Vyberte Anova: Single factor a kliknite na OK (existujú aj ďalšie možnosti, ako Anova: two factor with replication a Anova: two factor with replication)
  • Kliknite na pole Vstupný rozsah a vyberte rozsah
  • Kliknite na pole Výstupný rozsah a vyberte výstupný rozsah a kliknite na tlačidlo OK
  • Výsledok sa zobrazí v hárku programu Excel
  • Ak je F väčšie ako kritické, potom je neplatná hypotéza zamietnutá
  1. ANOVA pomocou SPSS

Najprv si stiahnite softvér SPSS a vykonajte ANOVA. Tu vidíme, ako vykonať jednosmernú ANOVA pomocou SPSS

SPSS vždy predpokladá, že nezávislá premenná je zastúpená číselne. Vo vzorke je MAJOR reťazec. Najprv teda skonvertujte reťazcovú premennú na číselnú premennú. Po dokončení konverzie ste pripravení urobiť ANOVA

  • Otvorte softvér SPSS
  • Kliknite na Analyzovať à Porovnať prostriedky jednosmernej ANOVA
  • Na obrazovke sa zobrazí jednosmerné dialógové okno ANOVA
  • Na ľavej strane dialógového okna sa zobrazí zoznam všetkých závislých premenných, ktoré ste zmerali. Pomocou horného tlačidla so šípkou ju presuňte do zoznamu Závislé na pravej strane
  • Rovnakým spôsobom presuňte nezávislú premennú v zozname na ľavej strane do poľa Faktor na pravej strane.
  • Kliknite na tlačidlo Post Hoc a vyberte typ viacnásobného porovnania, ktoré chcete urobiť.
  • Kliknutím na začiarkavacie políčko vedľa testu vyberte ľubovoľný test Post hoc, ktorý vyhovuje vášmu prieskumu
  • Kliknite na Pokračovať a dostanete sa do dialógového okna Jednosmerná ANOVA
  • Vyberte všetky štatistiky a kliknutím na začiarkavacie políčka naľavo od možnosti ju vyberte
  • Kliknutím na položku Prostriedky sprisahania získate anov graf grafu podmienok
  • Kliknite na tlačidlo Pokračovať a potom na tlačidlo OK

Zobrazí sa okno výstupu SPSS so šiestimi hlavnými sekciami

  • Opisná časť
  • Test homogenity variácií
  • ANOVA
  • Viacnásobné porovnania
  • Priemer bodu
  • graf

Veci, ktoré treba brať do úvahy pri spustení ANOVA

Úroveň údajov a predpoklady zohrávajú v ANOVA rozhodujúcu úlohu.

Výskumník by mal zistiť, či sú údaje prekrížené alebo vnorené. Ak sú údaje preškrtnuté, všetky skupiny dostanú všetky aspekty.

Ak sú údaje vnorené, každá skupina dostane inú metódu ANOVA.

Je dôležitejšie vypočítať veľkosť anova efektu. Veľkosť efektu vám môže povedať, do akej miery je nulová hypotéza nepravdivá. Vždy je výhodná veľkosť stredného efektu

Dúfam, že tento článok vám poskytol stručný prehľad o ANOVA a interpretácii výsledkov, ktoré ju používajú.

Súvisiace kurzy: -

  1. ANOVA pomocou Minitabu
  2. R Studio Anova Techniques Course

Kategórie: