Úvod do histogramu v R

V tomto článku začneme základným histogramom v implementácii R a prispôsobeniach. Histogram hrá dôležitú úlohu pri analýze údajov na vizualizáciu údajov. Programovanie R je špeciálne prostredie pre štatistické výpočty a základy pre vedu o údajoch. V programovaní R sú dátové súbory a funkcie zoskupené do podoby balíkov. Väčšina programov vizuálnej analýzy využíva histogramy a predvolene nastavuje šírku zásobníka. Umožňujú rýchlo pochopiť poznatky o údajoch, ktoré sú prvoradou úlohou vo vede údajov. Tu vytvoríme histogram pomocou príkazov R.

Čo je histogram?

Histogram predstavuje obrazové znázornenie distribúcie množiny údajov, pomocou ktorej by sme mohli ľahko analyzovať, ktorý faktor má väčšie množstvo údajov a najmenej údajov. Inými slovami, histogram umožňuje robiť kumulatívne grafy frekvencie na osi x a osi y. Histogramy vlastne berú ako zoskupené, tak zoskupené údaje. Pre zoskupené údaje sa histogram zostavuje s ohľadom na hranice triedy, zatiaľ čo v prípade ne zoskupených údajov je potrebné vytvoriť zoskupené rozdelenie frekvencií. Pomáhajú efektívne analyzovať rozsah a umiestnenie údajov. Počas distribúcie údajov sa používa nejaká spoločná štruktúra histogramov ako normálny, skosený, útes.

Na rozdiel od stĺpca, histogram grafu nemá medzery medzi pruhmi a stĺpce sú tu pomenované ako zásobníky, s ktorými sú dáta reprezentované v rovnakých intervaloch. Histogram Berie spojitú premennú a rozdeľuje sa do intervalov, je potrebné zvoliť správnu šírku zásobníka. Hlavný rozdiel medzi stĺpcovým grafom a histogramom je ten, ktorý používa súbory nominálnych údajov na vykreslenie, zatiaľ čo histogram vykresľuje súvislé súbory údajov. R používa hist () na vytváranie histogramov. Táto funkcia hist () používa vektor hodnôt na vykreslenie histogramu. Histogram obsahuje rozsah spojitých hodnôt na osi x, os y zobrazuje časté hodnoty údajov na osi x s stĺpcami variácií výšok.

syntaxe:

Syntax na vytvorenie histogramu je

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Vytvorenie histogramu v R.

Na účely analýzy vyžaduje histogram účelu, aby sa niektoré importované súbory údajov mohli importovať do R. R a jeho knižnice majú rôzne grafické balíčky a funkcie. Tu používame údaje švajčiarskych a leteckých cestujúcich. Na výpočet histogramu pre danú hodnotu údajov sa používa funkcia hist () spolu so znakom $ na výber určitého stĺpca údajov zo súboru údajov na vytvorenie histogramu.

Nasledujúci príklad vypočíta histogram hodnoty údajov v stĺpci Preskúmanie množiny údajov s názvom Swiss.

Príklad 1: Vytvorme jednoduchý histogram

kód:

hist (swiss $Examination)

Výkon:

Hist sa vytvorí pre súbor údajov švajčiarsky s preskúmaním stĺpcov. to jednoducho vykreslí kôš s frekvenciou a osou x.

Príklad 2: Histogram s viacerými argumentmi

Aby sme lepšie porozumeli histogramom, musíme k funkcii hist pridať ďalšie argumenty, aby sme optimalizovali vizualizáciu grafu. Zmena značky xay na rozsah hodnôt argumenty xlim a ylim sa pridajú do funkcie.

Príklad:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Výkon:

Nad kódom je vynesený histogram pre hodnoty z množiny údajov Leteckí cestujúci, dáva titul ako „Histogram pre viac arg“, štítok na osi x ako „Zoznam mien“ so zeleným orámovaním a žltou farbou do pruhov obmedzením hodnota ako 100 až 600, hodnoty vytlačené na osi y 2 a zväčšenie šírky zásobníka na 5.

Pridanie dvoch rôznych farieb na panel

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Výkon:

Pridanie ďalších stĺpcov do histogramu

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Výkon:

Príklad 3: Histogram v R vráti hodnotu

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Výkon:

Príklad 4: Použitie parametra prerušenia na zmenu šírky zásobníka

Ak chcete mať medzi šírkou viac bodov prerušenia, je výhodné použiť funkciu vo funkcii c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Výkon:

Vyššie uvedený graf berie šírku pruhu cez hodnoty sekvencie.

Príklad 5: Implementácia normálnej distribučnej krivky do histogramu

Na nakreslenie grafu použijeme množinu údajov „švajčiarsky“. Na zobrazenie distribučnej čiary sa tu používa funkčná krivka ().

kód:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Výkon:

Príklad 6: rozdelenie pravdepodobnosti vynesenia

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Vytvorenie grafu hustoty v histograme v R

Distribúcia premennej sa vytvorí pomocou funkčnej hustoty (). Nižšie je uvedený príklad s súborom údajov mtcars. Grafy hustoty pomáhajú pri distribúcii tvaru.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Výkon:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Nasledujúci histogram v R zobrazuje výšku ako vyšetrenie na osi x a hustota je vynesená na os y.

Výkon:

záver

To je všetko o histograme a práve histogram je najjednoduchší spôsob, ako porozumieť údajom. Ako sme videli s histogramom, mohli by sme kresliť jednotlivé grafy, pomocou šírky zásobníka, korekcie osí, zmeny farby atď. Histogram pomáha vizualizovať rôzne tvary údajov. Nakoniec sme videli, ako histogram umožňuje analyzovať súbory údajov a stredy sa používajú ako označenia triedy. Histogram pomáha v meniacich sa intervaloch vytvárať vylepšený opis údajov a pracuje najmä s číselnými údajmi. histogramy sú v analýze výhodnejšie, pretože majú výhodu veľkého množstva údajov. Na základe výstupov sme mohli vizuálne skresliť údaje a ľahko urobiť určité predpoklady.

Odporúčané články

Toto bol sprievodca histogramom v R. Tu sme diskutovali koncepciu, syntax a ako vytvoriť histogram v R s príkladmi. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Príklady histogramu
  2. Kariéra v programovaní R
  3. Ganttov diagram v Tableau
  4. Kariéra v počítačovom programovaní
  5. Ako vytvoriť čiarový graf v R?

Kategórie: