Úvod do balíkov R
Balíček je zbierka funkcií a súborov údajov. Balíky pomáhajú vylepšiť funkčnosť v programovacom jazyku. Ak chceme ukladať a spracúvať databázy (napr. Funkcie typu SQL využívajúce dátové rámce), potom môžeme použiť balík dplyr v R. Balíky tiež poskytujú dokumentáciu o tom, ako používať funkcie a množiny údajov v danom balíku.
Kde nájdeme balíky?
Balíky sú k dispozícii na internete z rôznych zdrojov. Existujú však určité dôveryhodné archívy, z ktorých si môžeme balíčky stiahnuť.
Tu sú dva dôležité archívy, ktoré sú k dispozícii online.
- CRAN (Comprehensive R Archive Network): Toto je oficiálna komunita R so sieťou FTP a webovými servermi, ktorá obsahuje najnovší kód a dokumentáciu R. Pred odoslaním balíkov online prechádza séria testov, ktoré sú v súlade s politikou CRAN.,
- GitHub: GitHub je ďalší slávny archív, ale nie je špecifický pre R. Komunita online môže zdieľať svoje balíčky s ostatnými ľuďmi a používa sa na kontrolu verzií. GitHub je open-source a nemá žiadny proces kontroly.
Zoznam užitočných R balíkov
Existuje niekoľko balíkov v R a môžete si ich stiahnuť z CRAN alebo GitHub. Nižšie sú uvedené balíčky, ktoré je možné použiť na konkrétne účely.
1. Načítanie údajov z externých zdrojov
- Haven: R číta a zapisuje údaje zo SAS.
- DBI: T o nadviazať komunikáciu medzi relačnou databázou a R.
- RSQlite: Používa sa na čítanie údajov z relačných databáz.
2. Manipulácia s údajmi
- Dplyr: Používa sa na manipuláciu s údajmi, ako je podmnožina, poskytuje skratky na prístup k údajom a generuje dotazy SQL.
- Tidyr - Používa sa na konverziu údajov do malých formátov.
- stringr - manipuluje s reťazcovými výrazmi a znakovými reťazcami.
- mazať - Na prácu s údajmi a časom.
3. Vizualizácia dát
- Rgl: Práca na 3D vizualizáciách.
- ggvis: Vytvorenie a vytvorenie gramatiky grafiky.
- googlevis: Použitie nástrojov vizualizácie spoločnosti Google v R.
4. Webové balíčky
- XML: Na čítanie a zápis dokumentov XML v R.
- Httpr: Práca s pripojeniami http.
- Jsonlite: Na čítanie tabuliek údajov json.
Získanie balíkov R
Pomocou nasledujúceho kódu môžeme skontrolovať dostupné balíčky, ktoré sú k dispozícii v R.
- available.packages (): V sieti CRAN je k dispozícii približne 5200 balíkov.
CRAN má zobrazenia úloh, ktoré zoskupujú balíčky podľa konkrétnej témy.
Inštalácia balíkov R
Balíky môžeme inštalovať priamo prostredníctvom IDE alebo pomocou príkazov. Na inštaláciu balíkov používame nižšie uvedenú funkciu a zadáme názov balíka.
syntaxe:
install.packages()
kód:
install.packages(“ggplot2”)
Vyššie uvedený kód nainštaluje balík ggplot2 a jeho závislé balíčky, ak existujú.
Môžeme nainštalovať niekoľko balíkov naraz zadaním názvov balíkov pod znakový vektor.
syntaxe:
install.packages(c(“package 1”, ”package 2”, ”package 3”))
kód:
install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))
Inštalácia pomocou aplikácie R Studio
Výhodou použitia R štúdia je GUI (Graphical User Interface). Môžeme si vybrať balíčky, ktoré sa majú nainštalovať, a ich zdroj.
Môžeme ísť na nástroje -> Inštalovať balíčky.
Načítavanie R balíkov
Po inštalácii balíka R ich musíme načítať do R, aby sme mohli začať využívať nainštalované balíčky.
Na načítanie balíkov používame funkciu uvedenú nižšie.
syntaxe:
library(package name)
kód:
library(ggplot2)
Existujú určité balíčky, ktoré zobrazujú správy pri načítaní. Niektorí z nich nie. Podrobnosti o nainštalovanej knižnici vidíme pomocou nižšie uvedeného kódu.
kód:
library(ggplot2)
search()
Výkon:
“Package: lattice” “package: ggplot2” “package: makinglides”
„Package: knitr“ „package: slidify“ „tools: rstudio“
Vytvorenie vlastného balíka
Pred vytvorením vlastného balíka. Skôr ako začneme vytvárať balík, mali by sme si pamätať na kontrolný zoznam uvedený nižšie.
- Organizácia kódu je jednou z najdôležitejších vecí pri písaní kódu do balíka. Namiesto vylepšenia kódu strácame polovicu času hľadaním umiestnenia kódu. Uložte všetky súbory do ľahko prístupného priečinka.
- Dokumentácia kódu vám pomôže pochopiť účel kódu. Keď kód často neaplikujeme, zabudneme, prečo sme ho napísali určitým spôsobom. Môže tiež pomôcť ľuďom lepšie porozumieť vášmu kódu, keď s nimi zdieľate.
- Zdieľanie skriptov prostredníctvom e-mailu sa stalo archaickým. Najjednoduchší spôsob je nahrať kód a distribuovať ho na GitHub. Je možné získať spätnú väzbu, ktorá vám môže pomôcť vylepšiť kód.
Ak chcete vytvoriť svoj vlastný balík, musíme nainštalovať balík devtools.
kód:
install.packages("devtools")
Na pomoc s dokumentáciou môžeme použiť balík uvedený nižšie.
kód:
install.packages("roxygen2")
Po inštalácii balíka devtools. Môžete si vytvoriť svoj vlastný balík.
kód:
devtools::create ("packagename")
Namiesto názvu „packagename“ môžete uviesť želané meno. Teraz môžete do tohto balíka pridať svoje funkcie.
Môžete vytvoriť rovnaký názov súboru ako názov funkcie.
syntaxe:
Devtools:create(“firstpackage”)
Distribučný balík
Balík môžete distribuovať na serveri github pomocou balíka devtools.
Nižšie uvedený kód používame na distribúciu nášho balíka na serveri github.
kód:
devtools::install_github("yourusername/firstpackage")
Vyššie môžete uviesť svoje užívateľské meno a názov balíka github.
Tu sú požadované súbory pre balík
- funkcie
- dokumentácia
- údaje
Akonáhle budeme mať všetky vyššie uvedené súbory, je dobré ich uverejniť v úložisku.
Odporúčané články
Toto je príručka pre balíky R. Tu diskutujeme o zozname užitočných balíkov R, inštalácii balíkov pomocou aplikácie R studio a vytvorení vlastného balíka, atď. Ďalšie informácie nájdete v nasledujúcich článkoch -
- Čo je to programovací jazyk R?
- Kariéra v programovaní R
- R Programovanie verzus Python
- MySQL vs SQLite
- Zoznam balíkov R