Úvod do rozptylu v R

  • R je programovací jazyk s otvoreným zdrojom, ktorý sa používa na štatistiku údajov a ich analýzu. So zvyšujúcou sa popularitou dátovej vedy získal R popularitu. Používajú sa najmä štatistici údajov a baníci údajov na získavanie cenných informácií z údajov. R je interpretovaný jazyk a má rozhranie príkazového riadku, ale existuje mnoho grafických používateľských rozhraní, ktoré uľahčujú prácu vývojárov. R ponúka veľké množstvo knižníc na implementáciu štatistík a grafických techník. R ponúka statickú grafiku; umožňuje používateľovi vytvárať vrstvený graf. Vytvára teda grafy kvality publikácií a poskytuje lepšiu reprezentáciu informácií.
  • R ponúka obrovskú množinu knižníc pre grafickú implementáciu, ale najobľúbenejší je „ggplot2“. GGPlot2 je implementácia „gramatiky grafiky“, ktorá zjednodušuje vytváranie zložitých grafov. Poskytuje programové rozhranie na špecifikovanie premenných, ich polohy, farby grafu, typov grafov a ďalších vizualizačných vlastností. Umožňuje vám vytvárať grafy krok za krokom, čo vám umožňuje vytvárať vrstvy pre rozsiahlu flexibilitu a kvalitu publikácie.
  • Jedným takým typom grafu je Scatterplot in R. Scatterplot in R, tiež nazývaný scatter chart, čo je typ grafu, ktorý ukazuje koreláciu medzi dvoma premennými. Zobrazuje údajové body vo forme bodiek. Môže sa kresliť medzi spojitou nezávislou premennou a inou premennou, ktorá závisí od predchádzajúcej premennej alebo dvoch spojitých nezávislých premenných. Korelácia môže byť kladná, záporná alebo nulová. Ak je sklon grafu zľava zľava doprava, korelácia je pozitívna. Ak je sklon od ľavého horného do pravého dolného rohu, korelácia je negatívna alebo inými slovami, zvýšenie hodnoty jednej premennej zníži hodnotu inej premennej.

Syntax: V grafoch je veľa balíkov, preto existuje veľa funkcií na vytvorenie Scatterplotu v R. Najzákladnejšou a najjednoduchšou funkciou je

dej (x, y)

kde

x označuje vodorovnú os alebo nezávislú súvislú premennú.

y označuje vertikálnu os alebo závislú premennú.

Existuje veľa ďalších parametrov na vykreslenie funkcie, aby bol graf ľahko zrozumiteľný.

Nižšie uvádzame niektoré s definíciou:

  • main: pridá do grafu nadpis
  • xlab: pridanie označenia na os x
  • ylab: pridá označenie na os y
  • xlim: určuje rozsah osi x
  • ylim: určuje rozsah osi y
  • pch: označuje tvar bodov v bodovom grafe
  • cex: označuje veľkosť bodov
  • col: definuje farbu bodov

Scatterplot in R sa dá vytvoriť aj pomocou balíka ggplot2. Najprv preto musíme nainštalovať a načítať balík ggplot2. Po pridaní balíka do aktuálnej relácie nižšie môžete príkaz použiť na vytvorenie Scatterplotu v R.

ggplot (dataset, aes (x, y, color, shape)) + geom_poin () + labs (x, y, title)

kde

  • súbor údajov je súbor údajov, pre ktorý je potrebné vytvoriť rozptyl.
  • aes () je estetické mapovanie v grafe. Popisuje, ako sa premenné mapujú do grafu.
  • x je vodorovná os alebo nezávislá súvislá premenná.
  • y je vertikálna os alebo závislá premenná.
  • farba znamená pridať farbu bodom na základe premennej zoskupovania.
  • tvar sa používa na nastavenie tvaru na základe zoskupovacej premennej.
  • znamienko + znamená, že príkaz pokračuje.
  • geom_point () je funkcia pre bodový graf.
  • laboratóriá (x, y, title): do grafu pridajte x label, y label a title.

Vytvorenie rozptylu v R.

Na vytvorenie Scatterplotu v R musíme najskôr načítať dataset. Tu používame dataset (mtcars) poskytnutý R. Najskôr nahrajte dataset do aktuálnej relácie pomocou príkazu nižšie

dáta (IRIS)

Po načítaní súboru údajov si zobrazte údaje a pomocou príkazu nižšie získate základné informácie o type údajov a stĺpcoch v ňom.

kosatec

Po získaní základného porozumenia údajov umožňuje jednoduché vytvorenie rozptylu pomocou funkcie plot

graf (clona $ Sepal.Length, clona $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Pridanie štítkov, aby bol graf čitateľný

graf (dúhovka $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “Width vs Dĺžka “)

Pridaním ďalšieho parametra urobíte graf atraktívnejším

graf (dúhovka $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “Width vs Dĺžka “, pch = 8, cex = 1, 5, col = 6)

Okrem týchto 2-D pozemkov je možné v R. vytvoriť aj maticové a 3-D pozemky.

Rozptylové matice

Ak máme v súbore údajov viac ako dve premenné a chceme nájsť koreláciu každej premennej so všetkými ostatnými premennými, použije sa matica rozptylu. Najzákladnejší a najjednoduchší príkaz pre rozptylovú maticu je:

páry (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, dáta = iris, main = ”Scatterplot Matrix”)

Vyššie uvedený graf ukazuje koreláciu medzi hmotnosťou, mpg, dsp a valcom.

Rozptyl 3D

Niekedy trojrozmerný graf poskytuje lepšie pochopenie údajov. Pre tento R poskytuje viac balíkov, jeden z nich je „scatterplot3d“. Nižšie sú uvedené príkazy na inštaláciu programu „scatterplot3d“ do pracovného priestoru R a jeho načítanie v aktuálnej relácii

install.packages ( "scatterplot3d")

knižnica (scatterplot3d)

Po načítaní knižnice sa vykonaním nižšie uvedených príkazov vytvorí trojrozmerný bodový test.

Príloha (iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = „3D Scatterplot“)

Okrem toho existuje mnoho ďalších spôsobov, ako vytvoriť trojrozmerný. Používatelia môžu tiež pridať podrobnosti, ako napríklad farbu, názvy, aby vylepšili graf. Užívateľ môže tiež vytvárať interaktívne 3D rozptyly pomocou funkcie „plot3D (x, y, z)“ poskytovanej balíkom „rgl“. Táto funkcia vytvára rotujúci 3D rozptyl, ktorý sa dá otáčať pomocou myši. Poskytuje tak úplný prehľad o korelácii medzi premennými.

záver

R je jedným z najznámejších jazykov pre implementáciu grafických techník používaných vedcami údajov. Poskytuje širokú škálu balíkov a knižníc pre grafiku a lepšie porozumenie dát. „Gglpot2“, „ggvis“, „rgl“, „plot3d“, „mriežka“, „animácia“, „gganimate“, „cairo“ sú niektoré z balíkov, ktoré poskytol R.

Bodový graf je najjednoduchší spôsob, ako lepšie porozumieť údajom. Pomocou tejto vizualizácie môže užívateľ poznať, ako premenné spolu súvisia, ako zmena hodnoty jednej premennej zmení hodnotu iných premenných atď. Sklon grafu hovorí o pozitívnom a negatívnom vzťahu medzi premennými.

Odporúčané články

Toto je sprievodca Scatterplotom v R. Tu diskutujeme úvod, rozptýlené matice, scatterplot 3D, ako vytvoriť scatterplot? spolu s príslušnými príkladmi. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je GraphQL
  2. Scrum Framework
  3. R Otázky na pohovor
  4. Úvod do binomického rozdelenia v R

Kategórie: