Úvod do balíkov R

Balíček je zbierka funkcií a súborov údajov. Balíky pomáhajú vylepšiť funkčnosť v programovacom jazyku. Ak chceme ukladať a spracúvať databázy (napr. Funkcie typu SQL využívajúce dátové rámce), potom môžeme použiť balík dplyr v R. Balíky tiež poskytujú dokumentáciu o tom, ako používať funkcie a množiny údajov v danom balíku.

Kde nájdeme balíky?

Balíky sú k dispozícii na internete z rôznych zdrojov. Existujú však určité dôveryhodné archívy, z ktorých si môžeme balíčky stiahnuť.

Tu sú dva dôležité archívy, ktoré sú k dispozícii online.

  • CRAN (Comprehensive R Archive Network): Toto je oficiálna komunita R so sieťou FTP a webovými servermi, ktorá obsahuje najnovší kód a dokumentáciu R. Pred odoslaním balíkov online prechádza séria testov, ktoré sú v súlade s politikou CRAN.,
  • GitHub: GitHub je ďalší slávny archív, ale nie je špecifický pre R. Komunita online môže zdieľať svoje balíčky s ostatnými ľuďmi a používa sa na kontrolu verzií. GitHub je open-source a nemá žiadny proces kontroly.

Zoznam užitočných R balíkov

Existuje niekoľko balíkov v R a môžete si ich stiahnuť z CRAN alebo GitHub. Nižšie sú uvedené balíčky, ktoré je možné použiť na konkrétne účely.

1. Načítanie údajov z externých zdrojov

  • Haven: R číta a zapisuje údaje zo SAS.
  • DBI: T o nadviazať komunikáciu medzi relačnou databázou a R.
  • RSQlite: Používa sa na čítanie údajov z relačných databáz.

2. Manipulácia s údajmi

  • Dplyr: Používa sa na manipuláciu s údajmi, ako je podmnožina, poskytuje skratky na prístup k údajom a generuje dotazy SQL.
  • Tidyr - Používa sa na konverziu údajov do malých formátov.
  • stringr - manipuluje s reťazcovými výrazmi a znakovými reťazcami.
  • mazať - Na prácu s údajmi a časom.

3. Vizualizácia dát

  • Rgl: Práca na 3D vizualizáciách.
  • ggvis: Vytvorenie a vytvorenie gramatiky grafiky.
  • googlevis: Použitie nástrojov vizualizácie spoločnosti Google v R.

4. Webové balíčky

  1. XML: Na čítanie a zápis dokumentov XML v R.
  2. Httpr: Práca s pripojeniami http.
  3. Jsonlite: Na čítanie tabuliek údajov json.

Získanie balíkov R

Pomocou nasledujúceho kódu môžeme skontrolovať dostupné balíčky, ktoré sú k dispozícii v R.

  • available.packages (): V sieti CRAN je k dispozícii približne 5200 balíkov.

CRAN má zobrazenia úloh, ktoré zoskupujú balíčky podľa konkrétnej témy.

Inštalácia balíkov R

Balíky môžeme inštalovať priamo prostredníctvom IDE alebo pomocou príkazov. Na inštaláciu balíkov používame nižšie uvedenú funkciu a zadáme názov balíka.

syntaxe:

install.packages()

kód:

install.packages(“ggplot2”)

Vyššie uvedený kód nainštaluje balík ggplot2 a jeho závislé balíčky, ak existujú.

Môžeme nainštalovať niekoľko balíkov naraz zadaním názvov balíkov pod znakový vektor.

syntaxe:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

kód:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Inštalácia pomocou aplikácie R Studio

Výhodou použitia R štúdia je GUI (Graphical User Interface). Môžeme si vybrať balíčky, ktoré sa majú nainštalovať, a ich zdroj.

Môžeme ísť na nástroje -> Inštalovať balíčky.

Načítavanie R balíkov

Po inštalácii balíka R ich musíme načítať do R, aby sme mohli začať využívať nainštalované balíčky.

Na načítanie balíkov používame funkciu uvedenú nižšie.

syntaxe:

library(package name)

Poznámka: Názov balíka nemusí byť uvedený v úvodzovkách.

kód:

library(ggplot2)

Existujú určité balíčky, ktoré zobrazujú správy pri načítaní. Niektorí z nich nie. Podrobnosti o nainštalovanej knižnici vidíme pomocou nižšie uvedeného kódu.

kód:

library(ggplot2)
search()

Výkon:

“Package: lattice” “package: ggplot2” “package: makinglides”

„Package: knitr“ „package: slidify“ „tools: rstudio“

Vytvorenie vlastného balíka

Pred vytvorením vlastného balíka. Skôr ako začneme vytvárať balík, mali by sme si pamätať na kontrolný zoznam uvedený nižšie.

  • Organizácia kódu je jednou z najdôležitejších vecí pri písaní kódu do balíka. Namiesto vylepšenia kódu strácame polovicu času hľadaním umiestnenia kódu. Uložte všetky súbory do ľahko prístupného priečinka.
  • Dokumentácia kódu vám pomôže pochopiť účel kódu. Keď kód často neaplikujeme, zabudneme, prečo sme ho napísali určitým spôsobom. Môže tiež pomôcť ľuďom lepšie porozumieť vášmu kódu, keď s nimi zdieľate.
  • Zdieľanie skriptov prostredníctvom e-mailu sa stalo archaickým. Najjednoduchší spôsob je nahrať kód a distribuovať ho na GitHub. Je možné získať spätnú väzbu, ktorá vám môže pomôcť vylepšiť kód.

Ak chcete vytvoriť svoj vlastný balík, musíme nainštalovať balík devtools.

kód:

install.packages("devtools")

Na pomoc s dokumentáciou môžeme použiť balík uvedený nižšie.

kód:

install.packages("roxygen2")

Po inštalácii balíka devtools. Môžete si vytvoriť svoj vlastný balík.

kód:

devtools::create ("packagename")

Namiesto názvu „packagename“ môžete uviesť želané meno. Teraz môžete do tohto balíka pridať svoje funkcie.

Môžete vytvoriť rovnaký názov súboru ako názov funkcie.

syntaxe:

Devtools:create(“firstpackage”)

Distribučný balík

Balík môžete distribuovať na serveri github pomocou balíka devtools.

Nižšie uvedený kód používame na distribúciu nášho balíka na serveri github.

kód:

devtools::install_github("yourusername/firstpackage")

Vyššie môžete uviesť svoje užívateľské meno a názov balíka github.

Tu sú požadované súbory pre balík

  • funkcie
  • dokumentácia
  • údaje

Akonáhle budeme mať všetky vyššie uvedené súbory, je dobré ich uverejniť v úložisku.

Odporúčané články

Toto je príručka pre balíky R. Tu diskutujeme o zozname užitočných balíkov R, inštalácii balíkov pomocou aplikácie R studio a vytvorení vlastného balíka, atď. Ďalšie informácie nájdete v nasledujúcich článkoch -

  1. Čo je to programovací jazyk R?
  2. Kariéra v programovaní R
  3. R Programovanie verzus Python
  4. MySQL vs SQLite
  5. Zoznam balíkov R

Kategórie: