Úvod do funkcie R String
Jazyk R alebo funkcie R String sa predpokladajú hlavne pre grafické znázornenie údajov, štatistickú analýzu údajov a podávanie správ. je to otvorený zdrojový jazyk. Konvencia pomenovania tohto jazyka bola odvodená z prvých písmen zakladateľov tohto jazyka, ktorými sú Ross Ihaka a Robert Gentleman. Je to interpretovaný programovací jazyk. Má schopnosť integrovať sa s rôznymi inými jazykovými postupmi, konkrétne s C ++, Pythonom atď. V súčasnosti je R najrozšírenejším programovacím jazykom na svete.
Funkcie funkcií R String
Kľúčové vlastnosti jazyka R sú uvedené nižšie,
- Jemne vyvinutý a veľmi jednoduchý štatistický jazyk.
- Ukladanie a spracovanie údajov sú veľmi efektívne zabudované v R.
- Ponúka veľkú skupinu klasifikovaných nástrojov, ktoré pomáhajú pri analýze údajov
- R tiež ponúka knižnice na dosiahnutie grafického znázornenia údajov
R reťazcové funkcie Manipulácia
Nižšie je uvedený zoznam funkcií manipulácie s reťazcami R.
1. Grep () v R String Functions
Používa sa na porovnanie vzoru v údajoch a nahradenie vzoru iným reťazcom. Grep funkcia môže byť vyjadrená niekoľkými spôsobmi v jazykoch R: regexpr, gregexpr grep, grepl a regexec.
Napr .: grep (vzor, x, ignorovať. Prípad = FALSE, perl = FALSE, hodnota = FALSE, pevná = FALSE, použite Bajty = FALSE, invertovať = FALSE)
argumenty:
- Pattern - Reťazec znakov obsahujúci obvyklý výraz, ktorý sa má rovnať danému znakovému vektoru.
- X, Text - Objekt, ktorý môže byť obmedzený ako znak na znakový vektor.
- Ignorovať. Prípad - (False - Práce na porovnávaní vzorov nerozlišujú veľké a malé písmená, True - Práce na porovnávaní vzorov rozlišujú malé a veľké písmená)
- Perl - Na určenie výrazov kompatibilných s Perl sa používajú najmä regexprns.
- Hodnota - Ak nájdená zhoda vráti hodnotu true, inak false,
- Použiť bajty - ak potom PRAVDY, zhoda sa vykoná bajt po bajte namiesto znak po znaku.
- Invertovať - Vracia indexy, ak je true,
- Nahradenie - Náhradný reťazec,
2. Nchar ()
Používa sa na spočítanie počtu znakov vo vektore. Berie ako argument vektor vo formáte reťazca a vracia ďalší číselný vektor, ktorý obsahuje počet reťazcov.
Napr .: nchar (x, type = “chars”, allowNA = FALSE, keepNA = NA)
argumenty:
- X - reťazec vektorov.
- Typ - Typ znakového reťazca, ktorý sa používa ako tri bežné znaky („bajty“, „znaky“, „šírka“).
- AllowNA - Predstavuje, či je možné ako výstup vrátiť „Neaplikovateľné“.
- KeepNA - Malo by sa vrátiť „Neaplikovateľné“, keď sa nenájde X.
3.Substr ()
Používa sa na výber hodnoty podreťazcov znakového vektora.
Príklad: subst (x, start, stop)
argumenty:
- X, text - Vektorové charterové reťazce.
- Štart, prvé - celé číslo. Začiatok prvku, ktorý sa má nahradiť
- Stop, Last - celé číslo. tu je nahradenie vykonané na konci reťazca
4. strsplit () v R String Functions
Používa sa na rozdelenie existujúceho vektorového reťazca do viacerých podreťazcov podľa zhody podreťazcov, ktoré sa v nich nachádzajú
Napr .: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)
argumenty:
- X - Znakový vektor, ktorý bude pľuli.
- Split - Vektor znakov, ktorý funguje ako oddeľovač.
- Opravené - Spravuje rovnaké rozdelenie, keď je odovzdané ako pravdivé
- Perl - Malo by sa používať regulárny výraz kompatibilný s Perlom?
- UseBytes - Ak je odovzdaný ako true, spustí porovnávanie bajtov po bajtoch namiesto porovnávania znakov podľa znakov
5. Regexpr ()
Viac ako grep dáva regexpr index, kde začína platná zhoda a dĺžka zodpovedajúceho reťazca, keď sa nenájde žiadna zhoda. Vráti sa hodnota -1.
Napr .: regexpr (vzor, text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE)
argumenty:
- Pattern - Reťazec znakov obsahujúci obvyklý výraz, ktorý sa má rovnať danému znakovému vektoru.
- X - znakový vektor
- Ignore.case - (False - Rozlišovanie malých a veľkých písmen pri porovnávaní vzorov, Pravda - Rozlišovanie malých a veľkých písmen pri rozdeľovaní písmen)
- Perl - Na určenie výrazov kompatibilných s Perl sa používajú najmä regexprns
- Hodnota - Ak nájdená zhoda vráti true, false, false
- UseBytes - Ak potom bude PRAVDIVÁ, zhoda sa vykoná bajt po bajte namiesto znak po znaku.
- Invertovať - Vráti indexy, ak sú pravdivé
6. Gregexpr () v R String Functions
Gregexpr poskytuje vráti zoznam podobnej dĺžky ako text, ktorého každý prvok má podobnú formu ako návratová hodnota regexpr, s výnimkou toho, že sú uvedené predbežné pozície každej (disjunktnej) zhody.
Syntax: gregexpr (vzor, text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE, extrakt = FALSE)
argumenty:
- Pattern - Reťazec znakov obsahujúci obvyklý výraz, ktorý sa má rovnať danému znakovému vektoru.
- X - znakový vektor
- Ignore.case - (False - Rozlišovanie malých a veľkých písmen pri porovnávaní vzorov, True - Rozlišovanie malých a veľkých písmen pri porovnávaní vzorov)
- Perl - Na určenie výrazov kompatibilných s Perl sa používajú najmä regexprns
- Hodnota - Ak nájdená zhoda vráti true, false, false
- UseBytes - Ak potom bude PRAVDIVÁ, zhoda sa vykoná bajt po bajte namiesto znak po znaku.
- Invertovať - Vráti indexy, ak sú pravdivé
- Extrahovať - Keď sa zhoduje logická indikácia, vytvorí sa a vráti sa extrakt z podreťazca
7. Regexec ()
Regexec () vo funkciách R String je veľmi podobný regexpr () s výnimkou indexov, ktoré sú uvedené v zátvorkách, vracajú sa príslušné vedľajšie výrazy.
Syntax: regexec (vzor, text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE)
argumenty:
- Vzor - Reťazec znakov obsahujúci obvyklý výraz, ktorý sa dá považovať za rovný danému znakovému vektoru.
- X - znakový vektor
- Ignore.case - (False - Rozlišovanie malých a veľkých písmen pri porovnávaní vzorov, True - Rozlišovanie malých a veľkých písmen pri rozdeľovaní písmen)
- Perl - Na určenie výrazov kompatibilných s Perl sa používajú najmä regexprns
- Hodnota - Ak nájdená zhoda vráti true, false, false
- UseBytes - Ak potom bude PRAVDIVÁ, zhoda sa vykoná bajt po bajte namiesto znak po znaku.
- Invertovať - Vracia indexy, ak sú pravdivé
Odporúčané články
Toto bol sprievodca funkciami R String. Tu sme diskutovali o koncepte, funkciách, manipulácii s R reťazcovými funkciami s príkladom a argumentmi. Ak sa chcete dozvedieť viac, môžete si tiež prečítať naše ďalšie navrhované články -
- Funkcie reťazca JavaScript
- Funkcie reťazca Oracle
- Funkcie reťazca T-SQL
- Funkcie reťazca VBScript
- Funkcie regulárnych výrazov v Pythone (príklad)