Úvod do označovania Boxplot v R

Štítky Boxplot pomáhajú pri vizualizácii distribuovaných údajov v R. Graf predstavuje strednú hodnotu, strednú hodnotu a rozptyl. Hodnoty sú uvedené ako vstup do funkcie boxplot (). Funkcia Boxplot () vytvára boxplot pomocou zadaných vstupných údajov. Boxplot je možné vytvoriť pre jednotlivé premenné alebo skupinu.

Vynesenie grafu Boxplot

  • Potrebujeme päť hodnotených vstupov ako priemer, rozptyl, medián, prvý a tretí kvartil.
  • Identifikácia, či sú v údajoch nejaké odľahlé hodnoty.
  • Navrhnite model na vykreslenie údajov.

Parametre funkcie boxplot ()

  1. vzorec: Tento parameter umožňuje rozložiť číselné hodnoty do niekoľkých skupín.
  2. Dáta :: Vstupné dáta, ktoré obsahujú buď dátový rámec alebo zoznam.
  3. Podmnožina: Voliteľný vektorový parameter na určenie podmnožiny pre vykreslenie.
  4. xlab: anotácia osi x
  5. ylab: Anotácia osi y.
  6. range: range určuje rozšírenia sprisahania.
  7. akcia: špecifikujte, čo sa stane, keď existuje nulová hodnota. Odozva alebo hodnota ignorujte.

Vytváranie náhodných údajov

Pomocou funkcie rnorm () môžeme vytvárať náhodné vzorky.

Poďme teraz použiť rnorm () na vytvorenie náhodných vzorových údajov s 10 hodnotami.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Vyššie uvedený príkaz vygeneruje 10 náhodných hodnôt so strednou hodnotou 3 a štandardnou odchýlkou ​​= 2 a uloží ich do dátového rámca.

Keď tlačíme údaje, dostaneme nižšie uvedený výstup.

STAT1

1 2, 662022

2 2, 184315

3 5, 974787

4 4, 536203

5 4, 808296

6 3, 817232

7 1, 135339

8 1, 583991

9 3, 308994

10 4, 6649170

Rovnaký vstup (dáta) môžeme previesť na funkciu boxplot, ktorá generuje graf.

K údajom pridávame ďalšie hodnoty a sledujeme, ako sa graf mení.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Pridanie ďalších náhodných hodnôt a ich použitie na znázornenie grafu.

Nižšie sú uvedené hodnoty, ktoré sú uložené v dátovej premennej.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Nižšie je uvedený boxplotový graf so 40 hodnotami. Na osi y máme 1-7 čísla a na osi x stat1 až stat4.

Zarovnanie textu na osi x môžeme zmeniť pomocou iného parametra s názvom las = 2.

Analýza grafu štítkov R Boxplot

Zadali sme vstup do dátového rámca a vidíme vyššie uvedený graf.

Aby sme porozumeli údajom, pozrime sa na hodnoty stat1.

Graf predstavuje všetkých 5 hodnôt. Počnúc minimálnou hodnotou zdola a potom tretím kvartilom, stredným, prvým kvartilom a minimálnou hodnotou.

Hore uvedený graf má vodorovné zarovnanie textu na osi x.

Zmena farby

Vo všetkých vyššie uvedených príkladoch sme videli zápletku čiernobielo. Pozrime sa, ako zmeniť farbu v zápletke.

Do funkcie boxplot () môžeme pridať parameter col = color.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Nižšie vidíme výstup grafu červenou farbou.

Použitím rovnakého vyššie uvedeného kódu môžeme do grafu pridať viac farieb.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Pridávanie štítkov

Menovky môžeme pridať pomocou parametrov xlab, ylab vo funkcii boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Použitím hlavného parametra môžeme do grafu pridať nadpis.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Parameter Notch sa používa na zvýšenie zrozumiteľnosti grafu. Pretože mediány stat1 až stat4 sa na vyššie uvedenom grafe nezhodujú.

Výhody a nevýhody Box Plot

výhody

  • Zhrnutie veľkého množstva údajov je ľahké pomocou etikiet boxplot.
  • Zobrazuje rozsah a distribúciu údajov na osi.
  • Označuje symetriu a skeessess
  • Pomáha identifikovať odľahlé hodnoty v údajoch.

nevýhody

  • Môže sa použiť iba na číselné údaje.
  • Ak sú v údajoch nezrovnalosti, nemôže byť vykreslenie presného poľa.

Poznámky:

  1. Grafy musia byť správne označené.
  2. Váhy sú dôležité; zmena mierky môže dať dátam iný pohľad.
  3. Porovnávanie údajov so správnymi mierkami by malo byť konzistentné

Záver - R Etikety spoločnosti Boxplot

Zoskupovanie údajov je ľahké pomocou boxplotov. Box plot podporuje viac premenných, ako aj rôzne optimalizácie. Môžeme tiež meniť mierky podľa údajov.

Boxplots sa môžu použiť na porovnanie rôznych dátových premenných alebo množín.

Použiteľnosť boxplotu je jednoduchá a pohodlná. Potrebujeme konzistentné údaje a správne štítky. Boxploty sa často používajú v oblasti informatiky a dokonca aj tímy predaja na zoskupovanie a porovnávanie údajov. Boxplot poskytuje informácie o potenciáli údajov a optimalizácii, ktoré je možné urobiť pre zvýšenie predaja.

Boxplot je zaujímavý spôsob testovania údajov, ktorý poskytuje informácie o vplyve a potenciáli údajov.

Odporúčané články

Toto je príručka pre štítky R Boxplot. Tu diskutujeme o funkcii Parameters under boxplot (), o tom, ako vytvárať náhodné údaje, meniť farebné a grafické analýzy spolu s výhodami a nevýhodami. Viac informácií nájdete aj v nasledujúcom článku -

  1. Typy vizualizácie údajov
  2. Implementácia dátového skladu
  3. Techniky vedy o údajoch
  4. Čo je to dátová kocka?

Kategórie: