Programiranje R - Vodnik za začetnike v programskem jeziku R



Ta blog o programiranju R vas seznani z R in vam s primeri pomaga podrobno razumeti različne temeljne koncepte programiranja R.

R je eno najbolj priljubljenih analitičnih orodij. Toda poleg tega, da se uporablja za analitiko, je R tudi programski jezik.Z njeno rastjo v IT industriji narašča povpraševanje po kvalificiranih oz z razumevanjem R kot orodja za analitiko podatkov in programskega jezika.V tem blogu vam bom pomagal razumeti različne osnove programiranja R. V našem str zavidljiv Spletni dnevnik ,razpravljali smo, zakaj potrebujemo analitiko, kaj je poslovna analitika, zakaj in kdo uporablja R.

V tem blogu bomo razumeli spodnje ključne koncepte programiranja R v naslednjem zaporedju:





  1. Spremenljivke
  2. Vrste podatkov
  3. Operaterji podatkov
  4. Pogojna izjava
  5. Zanke
  6. Funkcije

Lahko si ogledate posnetek spletnega seminarskega programa R Programming Language, kjer je naš inštruktor podrobno razložil teme s primeri, ki vam bodo pomagali bolje razumeti programiranje R.

R Programiranje za začetnike | R Vadnica za programski jezik R Edureka



Gremo torej naprej in si oglejmo prvi koncept programiranja R - spremenljivke.

R Programiranje: Spremenljivke

Spremenljivke niso nič drugega kot ime na pomnilniški lokaciji, ki vsebuje vrednost. Spremenljivka v R lahko shrani številske vrednosti, kompleksne vrednosti, besede, matrike in celo tabelo. Presenetljivo, kajne?

Spremenljivka - R programiranje - Edureka

Slika: Ustvarjanjespremenljivk



Zgornja slika nam prikazuje, kako nastajajo spremenljivke in kako so shranjene v različnih pomnilniških blokih. V R nam ni treba prijaviti spremenljivke, preden jo uporabimo, za razliko od drugih programskih jezikov, kot so Java, C, C ++ itd.

Pomaknimo se naprej in poskusimo razumeti, kaj je vrsta podatkov in različne vrste podatkov, ki jih podpira R.

R Programiranje: vrste podatkov

V R spremenljivka sama ni deklarirana za noben podatkovni tip, temveč prejme podatkovni tip predmeta R, ki ji je dodeljen. Torej R imenujemo dinamično tipkani jezik, kar pomeni, da lahko pri njegovi uporabi v programu znova in znova spremenimo podatkovni tip iste spremenljivke.

Data Types določa, katero vrsto vrednosti ima spremenljivka in katero vrsto matematičnih, relacijskih ali logičnih operacij je mogoče uporabiti zanjo, ne da bi povzročili napako. V R je veliko podatkovnih vrst, vendar so spodaj najpogosteje uporabljeni:

Zdaj bomo razpravljali o vsaki od teh vrst podatkov posebej, začenši od Vectors.

Vektorji

Vektorji so najosnovnejši R-podatkovni objekti in obstaja šest vrst atomskih vektorjev. Spodaj je šest atomskih vektorjev:

Logično : Uporablja se za shranjevanje logične vrednosti, kot je PRAV ali NAPAKA .

Številsko : Uporablja se za shranjevanje pozitivnih in negativnih števil, vključno z realnim številom.

Npr .: 25, 7.1145, 96547

Celo število : Vse vrednosti vsebuje celo število, torej vsa pozitivna in negativna cela števila.

Npr .: 45.479, -856.479, 0

Kompleksno : Ti so v obliki x + yi, kjer sta x in y številčna in i predstavlja kvadratni koren -1.

Npr .: 4 + 3i

Značaj : Uporablja se za shranjevanje enega samega znaka, skupine znakov (besed) ali skupine besed skupaj. Znaki so lahko opredeljeni v enojnih narekovajih ali dvojnih narekovajih.

Npr .: 'Edureka', 'R se je zabavno učiti'.

Na splošno je vektor definiran in inicializiran na naslednji način:

Vtr = c (2, 5, 11, 24) Ali Vtr<- c(2, 5, 11 , 24)

Pojdimo naprej in razumemo druge vrste podatkov v R.

Seznam

Seznami so precej podobni vektorjem, vendar so seznami R-predmeti, ki lahko vsebujejo elemente različnih vrst, kot so številke & minus, nizi, vektorji in drug seznam znotraj njih.

Npr:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Izhod:

[[1]] [1] 'Pozdravljeni' 'Živjo' 'Kako delate '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] TRUE

Matrica

Matrica je objekt R, v katerem so elementi razporejeni v dvodimenzionalni pravokotni postavitvi.

Osnovna sintaksa za ustvarjanje matrike v R je & minus

 matrika (podatki, nrow, ncol, byrow, dimnames) 

Kje:

  • podatkov je vhodni vektor, ki postane podatkovni element matrike.
  • Nrow je število vrstic, ki jih je treba ustvariti.
  • ncol je število stolpcev, ki jih je treba ustvariti.
  • byrow je logičen namig. Če je TRUE, so vhodni vektorski elementi razporejeni po vrsticah.
  • dimname je imena, dodeljena vrsticam in stolpcem.

Primer:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Izhod:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

NIZ

Polja v R so podatkovni objekti, ki jih lahko uporabimo za shranjevanje podatkov v več kot dveh dimenzijah. Za vhodne podatke jemlje vektorje in uporablja vrednosti v št parameter za ustvarjanje matrike.

Osnovna sintaksa za ustvarjanje matrike v R je & minus

 matrika (podatki, dim, dimnames) 

Kje:

  • podatkov je vhodni vektor, ki postane podatkovni element matrike.
  • št je dimenzija matrike, kjer posredujete število vrstic, stolpca in število matrik, ki jih želite ustvariti z omenjenimi dimenzijami.
  • dimname je imena, dodeljena vrsticam in stolpcem.

Primer:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Izhod:

,, ena [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Podatkovni okvir

Podatkovni okvir je tabela ali dvodimenzionalna struktura, podobna matriki, v kateri ima vsak stolpec vrednosti ene spremenljivke, vsaka vrstica pa en niz vrednostizavsak stolpec. Spodaj je nekaj značilnosti podatkovnega okvira, ki jih je treba upoštevati vsakič, ko sodelujemo z njimi:

  • Imena stolpcev ne smejo biti prazna.
  • Vsak stolpec mora vsebovati enako količino podatkovnih postavk.
  • Podatki, shranjeni v podatkovnem okviru, so lahko številčni, faktorji ali znakovni.
  • Imena vrstic naj bodo unikatna.

Primer:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & R ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Izhod:

emp_id emp_name odd 1 100 Janez Prodaja 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & R

Zdaj, ko smo razumeli osnovne podatkovne vrste R, je čas, da se poglobimo v R z razumevanjem konceptov upravljavcev podatkov.

R Programiranje: upravljavci podatkov

V R delu so v glavnem 4 operaterji podatkov, kot je prikazano spodaj:

Aritmetični operaterji : Ti operaterji nam pomagajo izvajati osnovne računske operacije, kot so seštevanje, odštevanje, množenje itd.

Upoštevajte naslednji primer:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # talni predel num3 = num1% /% num2 num3

Izhod:

[1] 35 [petnajst [1] 300 [1] 0,75 [1] 15 [1] 125 [enajst

Relacijski operaterji : Ti operaterji nam pomagajo izvajati relacijske operacije, kot je preverjanje, ali je spremenljivka večja, manjša ali enaka drugi spremenljivki. Rezultat relacijske operacije je vedno logična vrednost.

Upoštevajte naslednje primere:

num1 = 15 num2 = 20 #equals to num3 = (num1 == num2) num3 #not enako num3 = (num1! = num2) num3 #lesser than num3 = (num1 num2) num3 #less than same to num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Izhod:

[1] LAŽNO [1] TRUE [1] TRUE [1] LAŽNO [1] TRUE [1] LAŽNO

Operatorji dodelitve: Ti operaterji se uporabljajo za dodelitev vrednosti spremenljivkam v R. Dodelitev je mogoče izvesti z uporabo bodisi operaterja dodelitve(<-) ali je enak operatorju (=). Vrednost spremenljivke je mogoče dodeliti na dva načina, levo in desno.

LogičnoOperaterji: Ti operatorji primerjajo dve entiteti in se običajno uporabljajo z logičnimi (logičnimi) vrednostmi, kot sta 'in', 'ali'in'Ne'.


Programiranje R: Pogojne izjave

  1. Če izjava: Stavek If vam pomaga pri ocenjevanju posameznega izraza kot dela toka. Za izvedbo te ocene morate samo napisati ključno besedo If, ki ji sledi izraz, ki ga je treba oceniti. Spodnji diagram poteka bo pokazal, kako stavek If nadzoruje pretok kode: Razmislite o naslednjem primeru:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Izhod:

[1] 'Num1 je manjši ali enak Num2'
  • Izjava sicer: Stavek Else if vam pomaga razširiti veje na tok, ki ga ustvari stavek If, in vam daje priložnost, da ovrednotite več pogojev z ustvarjanjem novih vej toka. Spodnji tok vam bo predstavil, kako stavek else if veje tok kode:

    Upoštevajte naslednji primer:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 je manjši od Num1')} else if ('Num1 == Num2) {print (' Num1 in Num2 sta enaki ')}

    Izhod:

    [1] 'Num1 je manjši od Num2'

  • Druga izjava: Stavek else se uporablja, ko so vsi drugi izrazi označeni in so neveljavni. To bo zadnji stavek, ki se izvrši kot del podružnice If - Else if. Spodnji tok vam bo dal boljšo predstavo o tem, kako Else spreminja pretok kode:

Upoštevajte naslednji primer:

Num1 = 5 Num2 = 20, če (Num1 Num2) {print ('Num2 je manjši od Num1')} else print ('Num1 in Num2 sta enaka')}

Izhod:

[1] 'Num1 in Num2 sta enaki'

R Programiranje: zanke

Stavek zanke nam omogoča večkratno izvajanje stavka ali skupine stavkov. V R obstajajo predvsem 3 vrste zank:

  1. ponovite Loop : Ponovi stavek ali skupino stavkov, medtem ko je dani pogoj TRUE. Ponavljajoča zanka je najboljši primer izhodno nadzorovane zanke, kjer se koda najprej izvede, nato pa se preveri stanje, da se ugotovi, ali naj bo nadzor znotraj zanke ali izstopa iz nje. Spodaj je tok nadzora v ponavljajoči se zanki:
    Oglejmo si spodnji primer, da bomo razumeli, kako lahko s ponovitveno zanko dodamo n številk, dokler vsota ne preseže 100:

    x = 2 ponovite {x = x ^ 2 print (x) if (x> 100) {break}

    Izhod:

    [1] 4 [1] 16 [1] 256
  2. medtem ko Loop : jazt pomaga ponoviti stavek ali skupino stavkov, medtem ko je dani pogoj TRUE. Medtem ko je zanka v primerjavi s ponovitveno zanko nekoliko drugačna, je primer vhodno nadzorovane zanke, kjer se pogoj najprej preveri in le, če se ugotovi, da je pogoj resničen, se kontrolnik dostavi znotraj zanke za izvajanje kode . Spodaj je tok nadzora v zanki while:
    Oglejmo si spodnji primer, da dodamo vsoto kvadratov za prvih 10 številk in razumemo, kako zanka while deluje bolje:

    num = 1 vsota = 0, medtem ko (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Izhod:

    [enajst [petnajst [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. za Loop : Uporablja se za ponavljanje stavka ali skupine za določeno število krat. Za razliko od zanke repeat in while se zanka for uporablja v situacijah, ko se zavedamo, kolikokrat je treba kodo predhodno izvesti. Podobno je zanki while, kjer se pogoj najprej preveri, nato pa se izvrši samo koda, zapisana v njej. Oglejmo si tok nadzora for for zdaj:

Oglejmo si zdaj primer, kjer bomo z zanko for natisnili prvih 10 številk:

za (x v 1:10) {print (x)}

Izhod:

[enajst [1] 2 [1] 3 [1] 4 [petnajst [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programiranje: funkcije

Funkcija je blok organizirane kode za večkratno uporabo, ki se uporablja za izvedbo enega, povezanega dejanja. V R obstajata predvsem dve vrsti funkcij:

Vnaprej določene funkcije : To so vgrajene funkcije, ki jih uporabnik lahko uporablja za svoje delo easier. Npr .: mean( x) , sum( x) , kvadratt ( x ), kapa( x ) itd.

Uporabnik definiran Funkcije: Te funkcije ustvari uporabnik, da izpolni posebne zahteve uporabnika. Spodaj je sintaksa za ustvarjanje funkcije vR:

 func  ime_nacije  <– funkcijo (arg_1, arg_2 in & hellip){ // Telo funkcije }

Razmislite o naslednjem primeru preproste funkcije za generiranje vsote kvadratovod2 številki:

java, kaj doda dodatek
vsota_kvadrata<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Izhod: [1] 25

Upam, da ste uživali v branju tega spletnega dnevnika za programiranje R. V tej vadnici smo zajeli vse osnove R, tako da lahko začnete vaditi zdaj. Po tem spletnem dnevniku za programiranje R bom pripravil več spletnih dnevnikov na R za Analytics, zato bodite z nami.

Zdaj, ko ste razumeli osnove R, si oglejte Edureka, zaupanja vredno podjetje za spletno učenje z mrežo več kot 250.000 zadovoljnih učencev, razširjenih po vsem svetu. Edurekina podatkovna analitika z usposabljanjem R vam bo pomagala pridobiti znanje o programiranju R, manipulaciji s podatki, raziskovalni analizi podatkov, vizualizaciji podatkov, rudarjenju podatkov, regresiji, analizi sentimenta in uporabi RStudio za resnične študije primerov na področju maloprodaje, socialnih medijev.

Imate vprašanje za nas? Prosimo, omenite to v oddelku za komentarje tega spletnega dnevnika 'R Programming', mi se vam bomo javili v najkrajšem možnem času.