Prehľad dvojcestnej ANOVA v R
Obojsmerná ANOVA (Analysis of Variance) nám pomáha pochopiť vzťah medzi jednou súvislou závislou premennou a dvoma kategoricky nezávislými premennými. V tejto téme sa dozvieme o dvojsmernej ANOVE v R.
Nižšie sú uvedené hypotézy záujmu pod dvojsmernou ANOVA
- H₀: Nazývame to hlavný efekt, ktorý je prvým faktorom, ktorý je závislý od spojitej premennej
- H₀: Hlavný účinok sa týka aj účinku na druhú premennú na závislú súvislú premennú.
- H₀: Interakcia je kombinovaný účinok prvej, druhej a druhej faktorovej premennej na závislú premennú
Nižšie sú uvedené normy, ktoré musí dvojstranná ANOVA spĺňať.
- Pozorovania musia byť nezávislé
- Pozorovania by sa mali bežne distribuovať.
- Pripomienky by mali byť rovnaké
- Žiadne odľahlé hodnoty v dizajne
- Chyby by mali byť nezávislé.
Poznámka
Ak dôjde k porušeniu normality a rovnakého rozptylu, musíme transformovať naše údaje.
Príklad dvojsmernej ANOVA v R.
Urobme jednosmerný test ANOVA na súbore údajov o hladinách rakoviny, ktorý obsahuje 48 riadkov a 3 dátové premenné:
Čas odobratia: Čas prežitia zvieraťa
Rôzne úrovne rakoviny 1 - 3
Ošetrenie: Ošetrenia používané od 1-3
Pred testovaním potrebujeme nasledujúce údaje v ruke.
- Import údajov
- Odstráňte nepotrebnú premennú
- Premeniť premenné (úrovne rakoviny) na usporiadanú úroveň.
Nižšie je uvedený súbor údajov.
Pripomienky: 48
Premenné: 3
čas na prežitie 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 40, 0, 23, 0, 22, 0 …
hladiny rakoviny 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Ošetrenie A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, B, …
ciele
- H₀: žiadna zmena priemerného času prežitia medzi skupinami
- H₀: doba prežitia je rôzna pre aspoň jednu skupinu.
kroky
- Skontrolujte hladinu rakoviny. Vidíme tri hodnoty znakov, pretože ich prevádzame na faktory s mutovaným slovesom.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Vypočítajte strednú aj štandardnú odchýlku
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Výkon:
Tibble: 3 x 4
stredný čas sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 2676250 0, 06227627
- V treťom kroku môžete graficky skontrolovať, či existuje rozdiel medzi distribúciami. Všimnite si, že ste zahrnuli bodnutú bodku.
- Spustite test pomocou príkazu AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
syntaxe:
y ~ X1 + X2 + … + Xn (X1 + X2 + … označuje nezávislé premenné)
y ~. Všetky ostatné premenné používajte ako nezávislé premenné
Uistite sa, že ste model uložili a vytlačili zhrnutie.
kód
- aov (čas ~ hladiny rakoviny, údaje = df): Vykonajte test ANOVA s nasledujúcim vzorcom
- Súhrn (anova_one_way): Vytlačí zhrnutie testu
Df Sum Sq Priemerná hodnota Sq F Pr (> F)
Rakovina 1 2 033 0, 5165 11, 79 7, 66e-05 ***
Rezíduá 45 1, 972 0, 0438
-
Výrazným spôsobe. kódy: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
Hodnota p je nižšia ako prahová hodnota 0, 05. Štatistický rozdiel je v uvedenom prípade označený „*“.
One Way Test to Two Way Anova in R
Pozrime sa, ako je možné jednosmerný test rozšíriť na dvojsmernú ANOVA. Test je podobný jednosmernej analýze ANOVA, ale vzorec sa líši a do vzorca sa pridáva ďalšia skupinová premenná.
y = x1 + x2
- H0 : Stredné hodnoty sú rovnaké pre obe premenné (faktorové premenné)
- H3 : Prostriedky sa líšia pre obe premenné
Do nášho modelu pridáte liečebné premenné. Táto premenná označuje liečbu poskytnutú pacientovi. Zaujíma vás, či existuje štatistická závislosť medzi hladinami rakoviny a liečbou poskytovanou pacientovi.
Upravujeme náš kód pridaním liečby s inou nezávislou premennou.
Df Sum Sq Priemerná hodnota Sq F Pr (> F)
Úrovne rakoviny 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Liečba 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Rezíduá 42 1, 0509 0, 0250
Hladiny rakoviny aj liečba sú štatisticky odlišné od 0. Týmto môžeme vyvrátiť hypotézu NULL. Potvrďte tiež, že zmena liečby alebo typu rakoviny ovplyvňuje čas prežitia.
skúška
Jednosmerná ANOVA: H3- Priemer sa líši najmenej pre jednu skupinu
Obojsmerná ANOVA: H3- Priemer sa líši pre obe skupiny.
Rozdiel medzi jednosmernou a dvojcestnou ANOVA
Rozdiely medzi jednosmernou ANOVA a dvojsmernou ANOVA
Jednosmerná ANOVA | Obojsmerná ANOVA |
Navrhnuté tak, aby umožňovali testovanie rovnosti medzi 3 alebo viacerými prostriedkami | Určené na hodnotenie vzájomného vzťahu dvoch nezávislých premenných na závislej premennej. |
Zahŕňa jednu nezávislú premennú | Zahŕňa dve nezávislé premenné |
Analyzované v 3 alebo viacerých kategórií. | Porovnáva viaceré skupiny dvoch faktorov |
Musí spĺňať dva princípy - replikáciu a randomizáciu | Musí spĺňať tri zásady, ktorými sú replikácia, randomizácia a miestna kontrola. |
Výhody dvojcestnej ANOVA
- V uvedenom príklade vek a pohlavie v našom príklade - pomáhajú znižovať odchýlky chýb a zefektívňujú dizajn.
- Obojsmerná ANOVA nám umožňuje testovať účinok dvoch faktorov súčasne.
Aplikácie ANOVA
- Porovnanie najazdených kilometrov rôznych vozidiel, palív a typov ciest.
- Oboznámenie sa s vplyvom teploty, tlaku alebo chemickej koncentrácie na niektoré chemické reakcie (energetické reaktory, chemické závody atď.)
- Vplyv rôznych katalyzátorov na rýchlosť chemickej reakcie
- Pochopenie vplyvu reklám a rôzneho počtu reakcií zákazníkov.
- Vplyv výkonnosti, kvality a rýchlosti výroby v biológii (proces založený na počte buniek, na ktoré sa delia)
Odporúčané články
Toto je sprievodca dvojcestnou ANOVA v R. Tu diskutujeme príklady, ciele, kroky a rozdiel medzi jednosmernou a dvojcestnou ANOVA. Ďalšie informácie nájdete aj v nasledujúcich článkoch -
- ANOVA v R.
- Ako interpretovať výsledky pomocou testu ANOVA
- Regresia vs. ANOVA
- GLM v R.