Úvod do zoznamu R balíkov

Balík v programovacom jazyku R je jednotka, ktorá poskytuje požadované funkcie, ktoré je možné využiť ich načítaním do prostredia R. Zoznam balíkov R je podobný ako knižnica v jazykoch C, C ++ alebo Java. Balík tak môže mať v podstate mnoho funkcií, ako sú funkcie, konštanty atď., Ktoré používateľovi umožníme ich využívať v kontexte konkrétneho problému. V R možno požadovaný balík načítať pomocou funkcie library (). V prípade, že balík nie je k dispozícii, môžete ho nainštalovať pomocou funkcie install.packages (). Balíčky uľahčujú vďaka svojim hotovým funkciám zdanlivo ťažké úlohy.

Čo sú to balíky R?

Existuje veľa balíkov v R a výber balíka závisí od jeho aplikácie. Aj keď existujú určité balíčky, ktoré sa často používajú kvôli funkčnosti, ktoré poskytujú, nie je to tak, že iné balíčky sú menej dôležité. Rôzne obaly majú rôzne účely; niektoré súvisia so štatistickými technikami, iné sa týkajú vizualizácie atď.

V nasledujúcej časti sa pozrieme na niektoré dôležité balíčky v jazyku R:

1. Auto

Tento balík je Sprievodca aplikovanou regresiou. Je to veľký balík, ktorý poskytuje rôzne funkcie pre štatistickú analýzu. Pri importovaní tohto balíka do prostredia R sa importujú ďalšie súvisiace balíky, ako napríklad MASS, štatistika, grafika atď. Niektoré funkcie v balíku zahŕňajú Anova, avPlots, Boxplot, carPalette, grafy hustoty, infIndexPlot, lineárna hypotéza, logit, test odľahlých hodnôt, qqPlot, zvyškové grafy, rozptyl, matica rozptylu, atď. Rozsiahle možnosti balíka sa dajú vypočítať z počtu funkcií, ktoré poskytuje.

2. Corrplot

Balík poskytuje grafické zobrazenie korelačnej matice a intervalu spoľahlivosti. Balíček tiež poskytuje algoritmy na vykonanie poradia matíc. Početné možnosti zahŕňajú výber požadovaných farieb, textových štítkov, farebných štítkov, rozmiestnenia atď. Rôzne vizualizačné metódy alebo metódy parametrov v balíku corrplot sú „kruh“, „štvorec“, „elipsa“, „číslo“, „odtieň“, „farba“. a „koláč“. Corrplotova funkcia zahŕňajúca rôzne možnosti poskytuje vizuálne príťažlivú reprezentáciu korelácie medzi rôznymi premennými, ktoré by sa za normálnych okolností, ako sú čísla, ťažko interpretovali. Pozitívne korelácie sú zobrazené modrou farbou a negatívne korelácie červenou farbou. Intenzita farby a veľkosť kruhu sú úmerné korelačným koeficientom.

3. DataExplorer

Tento balík sa zaoberá automatizovaným prieskumom a spracovaním údajov. Poskytuje automatizovaný proces prieskumu údajov určený pre analytické úlohy a prediktívne modelovanie. Je to rozhodujúce, pretože umožňuje používateľovi porozumieť údajom a extrahovať informácie. Každá premenná v analýze je skenovaná a analyzovaná balíkom. Balík ďalej poskytuje funkcie na vizualizáciu týchto premenných pomocou typických grafických techník. Poskytuje tiež bežné metódy spracovania údajov pre spracovanie a formátovanie údajov.

4. Gmodely

Balík gmodels poskytuje v nástroji R rôzne nástroje na vykreslenie údajov. Obsahuje rôzne funkcie, napríklad glh.test, ktoré sa používajú na testovanie, tlač alebo zhrnutie všeobecnej lineárnej hypotézy regresného modelu. Táto funkcia je. kontrasty prevádzajú ľudsky čitateľné kontrasty do formy, ktorú R vyžaduje na výpočet. Matica vrátená pomocou make.contrasts sa môže použiť ako argument k argumentu kontrastov o modelových funkciách. Funkcia coefFrame zapadá do modelu do každej podskupiny, ktorú definuje , potom vráti dátový rámec s jedným riadkom pre každé prispôsobenie a jedným stĺpcom pre každý parameter. Odhadovateľná funkcia počíta a testuje kontrasty a iné odhadnuteľné lineárne funkcie modelových koeficientov pre lm, glm atď. Funkcia fit.contrast počíta a testuje ľubovoľné kontrasty pre regresné objekty.

5. Gplots

Tento balík poskytuje vizualizačné funkcie prostredníctvom rôznych programovacích nástrojov. Funkcie v balíku pracujú na koncepcii výpočtu a vykresľovania. Grafické možnosti balíka sú demonštrované rôznymi funkciami, ako sú pásmový graf, boxplot2, col2hex, ci2d, hist2d, textový graf, grafický drez, pilot balónu, plotCI, plot plot atď. Tieto funkcie umožňujú prácu s nastaveniami týkajúcimi sa farby, text a ďalšie zložité grafické aspekty vizualizácie. Zaoberajú sa aj zložitými prvkami, ktoré sa podieľajú na vizualizácii založenej na štatistikách, napr. Lmplot2, rezidenčnými funkciami, ktoré umožňujú používateľovi riadiť podrobnú regresnú diagnostiku prostredníctvom diagnostických grafov. Ak je potrebné vykresliť viac údajov v tej istej oblasti, ale so samostatnými osami, je to možné pomocou funkcie nad grafom v balíku.

6. Ggplot2

Je to jeden z veľmi známych balíkov v R, ktorý poskytuje rozsiahle vizuálne schopnosti a prezentuje výsledky aj zložitých štatistických a matematických techník. Početné funkcionality, ktoré tento balík poskytuje, umožňujú analytikom odvodiť informácie z údajov interaktívnejšie. Opis R funkcie je „systém pre deklaratívne vytváranie grafiky, ktorý je založený na gramatike grafiky“. Táto gramatika grafiky znamená, že používateľ musí povedať „ggplot2“ o spôsobe, akým sa premenné musia mapovať na estetiku, takže to v podstate znamená, že špecifikovanie grafických aspektov, ktoré sa majú použiť, a ggplot2 budú na základe detailov fungovať.

7. Namažte

Tento balík R uľahčuje prácu s dátumami a časmi. Mazací balík umožňuje ľahkú manipuláciu s údajmi o dátume a čase. Analyzuje číslo a poskytuje vhodné usporiadanie údajov, v skutočnosti funkcie analýzy v balíku spracovávajú širokú škálu formátov a oddeľovačov, čo zjednodušuje proces analýzy. Jednou z pozoruhodných vlastností je, že balík poskytuje funkcie na spracovanie údajov s rôznymi časovými pásmami.

8. Hmisc

Balík Hmisc, pomenovaný Harrell Miscellaneous, obsahuje mnoho funkcií, ktoré je možné využiť na analýzu údajov, grafiku na vysokej úrovni a obslužné programy. Zahŕňa tiež funkcie na výpočet veľkosti a výkonu vzorky, importovanie a anotovanie súborov údajov, imputovanie chýbajúcich hodnôt, poskytovanie pokročilých funkcií tabuliek, zoskupovanie premenných, manipuláciu so znakovým reťazcom, konverziu objektov R na HTML kód atď.

9. Mreža

Balíček ponúka vizualizačný systém na vysokej úrovni, ktorý bol inšpirovaný grafikou Trellis. Zdôrazňuje viacrozmerné údaje. Výkonné vizualizačné schopnosti balíka poskytujú potrebné grafické riešenie. Niektoré z významných funkcií v balíku sú B_07_cloud, ktoré pomáhajú vytvárať 3D bodový graf a plošný graf drôtu; D_level. farby, funkcia na výpočet falošných farieb predstavujúcich číselnú alebo kategorickú premennú; B_06_levelplot, funkcia, ktorá generuje vodorovné a obrysové grafy; A_01_Lattice, funkcia, ktorá poskytuje grafické funkcie mriežky. B_09_tmd je funkcia, ktorá generuje Tukey Mean - Difference Plot; B_11_oneway, funkcia, ktorá vyhovuje jednosmernému modelu. Balík teda poskytuje rozsiahle funkcie na vizualizáciu pomocou rôznych funkcií.

10. MatrixModels

Tento balík umožňuje modelovanie s riedkymi a hustými maticovými maticami. Na dosiahnutie tohto cieľa používa modulárne predpovede a reakcie, triedy modulov. Všetky funkcie, ktoré poskytuje balík, sú rovnako dôležité, z ktorých niektoré sú lm.fit.sparse, čo je fitterová funkcia pre riedke lineárne modely, solutionCoef, ktorý rieši koeficienty a prírastky koeficientov, model. Matica, ktorá vytvára pravdepodobne riedke matice návrhu alebo modelu, glm4, ktorá vyhovuje zovšeobecneným lineárnym modelom.

11. Multcomp

Balík umožňuje viacnásobné porovnávanie k skupín v zovšeobecnených lineárnych modeloch. Zoznam deviatich štandardných postupov viz. Užívateľ má k dispozícii Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott a Tetrade a užívateľ vyberie porovnania na základe požiadavky. Okrem toho je pre kontrastnú maticu tiež k dispozícii voľné vstupné rozhranie, ktoré umožňuje špeciálne porovnania. Pozoruhodné je, že samotné porovnania sa neobmedzujú na nijaký konkrétny návrh, ako je vyvážený alebo jednoduchý, ale programy sú navrhnuté tak, aby vyhovovali viacnásobnému porovnávaniu v rámci všeobecného lineárneho modelu, ktorý umožňuje korelácie, korelované prostriedky, chýbajúce hodnoty., atď.

12. OpenMx

Tento balík sa v podstate zaoberá rozšíreným modelovaním štruktúrnych rovníc. Poskytuje funkcie na vytváranie modelov štruktúrnych rovníc. S týmito modelmi sa dá manipulovať pomocou programovania. Modely môžu byť špecifikované maticami alebo cestami ako LISREL alebo RAM. Niektoré z typov modelov zahŕňajú viac skupín, potvrdzujúci faktor, rozdelenie zmesi, kategorický prah, funkcie diferenciálneho prispôsobenia atď.

13. Plyr

Je to veľmi dôležitý balík, ktorý poskytuje funkcie na manipuláciu s údajmi. Poskytuje nástroje na rozdelenie, aplikáciu a kombináciu údajov. Dodáva sa so sadou nástrojov, ktoré pomáhajú riešiť bežnú skupinu problémov. Napríklad niekedy bude možno potrebné rozbiť veľkú úlohu na menšie úlohy, ktoré sú zvládnuteľné, potom pracujeme na každej z týchto častí a nakoniec nakoniec všetky dáme dohromady.

14. Qcc

Balík nadobúda význam vďaka rôznym funkciám analýzy kvality, ktoré poskytuje. Poskytuje grafy kontroly kvality Shewhart pre kontinuálne, atribúty a počíta dáta. Medzi ďalšie dôležité tabuľky patria tabuľky Cusum a EWMA a krivky prevádzkových charakteristík. Ponúka tiež funkčnosť analýzy spôsobilosti procesu. Pareto graf a tabuľka príčin a následkov a viacrozmerné kontrolné tabuľky sú užitočné nástroje, ktoré poskytuje balík.

15. RandomForest

Ako už názov napovedá, tento balík sa používa na zostavenie náhodného algoritmu doménovej štruktúry. Balíček implementuje algoritmus náhodných domén Breimana, ktorý je založený na pôvodnom kóde Beimana a Cutlera FORTRAN. Algoritmus sa používa na klasifikáciu a regresiu. Balík môže byť tiež použitý v režime bez dozoru na posúdenie blízkosti medzi dátovými bodmi.

16. Psych

Je to balík určený na osobitné účely. Balíček poskytuje postup pre psychologický, psychometrický a osobnostný výskum. Funkcie sú primárne pre multivariačnú analýzu pomocou rôznych multivariačných štatistických techník.

Záverečný zoznam balíkov R

Existuje veľa balíkov v R a použitie balíka závisí od požiadaviek. Komunita Zoznam balíkov R rastie veľmi rýchlo a každý deň sa pridáva balík. Viacnásobné balenia môžu poskytovať podobné funkcie, ale výber balíka musí vychádzať z jeho dôkladného preštudovania.

Odporúčané články

Toto je sprievodca zoznamom balíkov R. Tu diskutujeme o úvode do balíčkov R a niektorých dôležitých balíkoch R. Ďalšie informácie nájdete aj v ďalších navrhovaných článkoch -

  1. Balíky Java
  2. Čo je JNDI v Jave?
  3. JColorChooser
  4. R Programovanie verzus Python

Kategórie: