Prehľad dátového rámca R

Dátové rámce sú zoznamom vektorov s rovnakou dĺžkou. Rozdiel medzi maticovým a dátovým rámcom je však v tom, že dátové rámce prijímajú rôzne typy údajov. (Znak, číselný atď.). V tejto téme sa dozvieme viac o R dátovom rámci.

Výhody použitia dátových rámcov

  • Distribuovaný a organizovaný zber údajov.
  • Má lepšie optimalizácie v porovnaní s relačnou databázou.
  • Obsahuje rôzne údaje, ktoré sú heterogénne.

Vytvorenie dátového rámca v R

Vytvárame data_frame. Nižšie je uvedený príklad deklarovania dátového rámca.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Vo vyššie uvedenom príklade sme nedefinovali premenné. Pozrime sa teraz, ako priradíme hodnoty premenným a uložíme ich do dátového rámca.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Výkon:

Počet booleovcov

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

Štruktúra dátového rámca

Keď chceme poznať štruktúru konkrétneho dátového rámca. Môžeme použiť funkciu uvedenú nižšie.

Hviezda ()

str(Data_frame)

Výkon:

Počet: 2 3 4

alfa: Faktor w / 3 úrovne „x“, „y“, „z“: 1 2 3

Booleans: logi TRUE TRUE FALSE

Extrahovanie konkrétnych údajov z dátového rámca

1. Pomocou názvu stĺpca

Môžeme extrahovať konkrétnu skupinu údajov z dátového rámca.

Z nášho vyššie uvedeného príkladu extrahujme iba prvý stĺpec z dátového rámca, ktorým je číslo.

Data_ frame <- data. Frame(Number)

Výkon:

číslo

1 2

2 3

3 4

2. Pomocou riadkov

Údaje z riadkov môžeme extrahovať rovnako ako v nasledujúcom príklade.

Predpokladajme, že chceme tlačiť iba dva riadky stĺpca Number.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Výkon:

Počet booleovcov

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

------------

Počet booleovcov

1 2 x PRAVDA

2 3 y PRAVDA

Môžeme pozorovať rozdiel v prvom a druhom výstupe.

3. Tlač konkrétnych riadkov a stĺpcov

Môžeme tiež tlačiť konkrétne riadky a stĺpce.

V nižšie uvedenom príklade tlačíme 1. a 2. riadok, stĺpec

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Výkon:

Počet booleovcov

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

-------------

Číslo alfa

1 2 x

2 3 r

4. Pridanie ďalšieho stĺpca do dátového rámca

Do dátového rámca môžeme pridať ďalší stĺpec spolu s hodnotami.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Výkon:

Trieda alfa booleovských tried

1 2 x PRAVDA A

2 3 y PRAVDA B

3 4 z FALSE C

5. Pridanie riadku do dátového rámca

Pomocou funkcie rbind pridáme nový riadok do existujúceho dátového rámca.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Výkon:

Trieda alfa booleovských tried

1 2 x PRAVDA A

2 3 y PRAVDA B

3 4 z FALSE C

4 5 x FALSE D

6. Kombinácia oboch dátových rámcov

Môžeme tiež kombinovať dva dátové rámce na vytvorenie jedného výstupu.

Aby sme skombinovali dva dátové rámce, musíme mať rovnaký stĺpec pre dátové rámce.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Výkon:

Počet booleovcov
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
--------------
Počet booleovcov
1 4 x PRAVDA
2 5 rokov PRAVDA
3 6 z FALSE

--------------

Počet booleovcov
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 4 x PRAVDA
5 5 rokov PRAVDA
6 6 z FALSE

Kontrola dátových rámcov

Nižšie sú uvedené rôzne spôsoby kontroly dátového rámca a poskytuje informácie o dátovom rámci rovnako ako vyššie uvedená funkcia hviezdy.

1. Mená - Poskytuje názvy premenných v údajovom rámci

Syntax : names(data frame name)

príklad

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

výstup : (1) „Number“ „alpha“ „Booleans“

2. Summary - Poskytuje štatistiku dátového rámca.

Syntax: summary(data frame name)

príklad

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Výkon:

Počet booleovcov
Min. : 2, 0 x: 1 režim: logický
1. Qu.:2.5 y: 1 FALSE: 1
Medián: 3, 0 z: 1 PRAVDA: 2
Priemer: 3, 0 NA: 0
3. Qu.:3.5
Max. : 4.0

3. Head - Poskytuje údaje pre niekoľko prvých riadkov.

Syntax: Head( name of the data frame)

príklad

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Výkon:

Počet booleovcov
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 5 PRAVDY
5 6 b FALSE
6 7 c FALSE

4. Tail- Vytlačí posledných niekoľko riadkov v dátovom rámci.

Syntax: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Výkon:

Počet booleovcov
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE

záver

Dátové rámce sú dôležitým konceptom v programovaní typu R. Je jednoduché, ale výkonné pri vytváraní množín údajov, ktoré je možné ľahko modifikovať a získať k nim prístup. Rovnako ako matica, k súborom údajov sa dá pristupovať prostredníctvom riadkov a názvov stĺpcov, pričom je ľahké pridávať a odoberať údaje.

Odporúčané články

Toto je sprievodca R dátovým rámcom. Tu diskutujeme o vytvorení dátového rámca v R so štruktúrou a extrahovaní konkrétnych údajov z dátového rámca. Ďalšie informácie nájdete aj v nasledujúcich článkoch -

  1. Typy údajov v C
  2. Kariéra v oblasti vedy o údajoch
  3. Veľké dátové technológie
  4. Platforma pre vedu o údajoch
  5. Java Booleans

Kategórie: