R je najbolj priljubljeno orodje za analitiko podatkov, saj je odprtokodno, prilagodljivo, ponuja več paketov in ima ogromno skupnosti. Zasnovan je tako za programerje programske opreme, statistike in rudarje podatkov, zato je tudi priljubljen .V tem blogu R Tutorial vam bom dal popoln vpogled v R s primeri.
Spodaj so teme v tem blogu R Tutorial, o katerih bom razpravljal v naslednjem zaporedju:
- Zakaj potrebujemo Analytics ?
- Kaj je poslovna analitika ?
- Zakaj R in kdo uporablja R ?
- Namestitev R
- Operaterji podatkov
- Vrste podatkov
- Nadzor toka
R Vadnica: Zakaj potrebujemo analitiko?
Preden odgovorim na vprašanje, naj vas seznanim z nekaterimi težavami in njihovimi rešitvami v R na več domenah.
Bančništvo :
V bankah se vsak dan ustvari velika količina podatkov o strankah. WHile, ki se redno ukvarja z milijoni strank, je težko slediti njihovim hipotekam.
Rešitev :
R izdeluje model po meri, ki ohranja posojila, ki jih prejme vsaka posamezna stranka, kar nam pomaga, da se sčasoma odločimo za znesek, ki ga mora plačati stranka.
Zavarovanje :
Zavarovanje je močno odvisno od napovedi. Težko jeodločiti, katero politiko sprejeti ali zavrniti.
Rešitev:
Z uporabo neprekinjenega kreditnega poročila kot vhodnega podatka lahko v R ustvarimo model, ki ne bo le ocenil nagnjenosti k tveganju, temveč tudi napovedal napoved.
Skrb za zdravje:
Vsako leto v bolnišnico sprejmejo milijone ljudi, letno pa jih porabijo samo v času sprejema.
Rešitev :
Glede na anamnezo bolnikov in anamnezo je mogoče zgraditi napovedni model, s katerim se ugotovi, kdo je v nevarnosti za hospitalizacijo in v kolikšni meri je treba medicinsko opremo prilagoditi.
Zdaj vemo, kako analitika podatkov organizacijam pomaga izkoristiti svoje podatke in jih uporabiti za prepoznavanje novih priložnosti. Če govorimo o potrebi po analitiki v organizaciji, morate naleteti na te 4 vidike:
Nato pojdimo naprej v R tutorial blog, kjer bomo najprej razumeli, kaj pravzaprav je poslovna analitika.
R Vadnica: Kaj je poslovna analitika?
Poslovna analitika je postopek preučevanja velikih naborov podatkov in doseganja skritih vzorcev, korelacij in drugih spoznanj. V bistvu vam pomaga razumeti vse podatke, ki ste jih zbrali, pa naj gre za organizacijske podatke, podatke o raziskavah trga ali izdelkov ali katere koli druge vrste podatkov. Z lahkoto sprejemate boljše odločitve, boljše izdelke, boljše tržne strategije itd. Za boljše razumevanje glejte spodnjo sliko:
Če pogledate zgornjo sliko, so vaši podatki na prvi sliki razpršeni. Če želite v zbirki podatkov nekaj posebnega, na primer določen zapis, postane okoren. Za poenostavitev potrebujete analizo. Z analizo postane enostavno vzpostaviti korelacijo med podatki. Ko ugotovite, kaj storiti, vam postane povsem enostavno sprejemati odločitve, na primer, kateri poti želite slediti ali v smislu poslovne analitike, katera pot bo vodila k izboljšanju vaše organizacije.
Ne morete pa pričakovati, da bodo ljudje v zgornji verigi po analizi vedno razumeli neobdelane podatke, ki jim jih posredujete. Za premagovanje te vrzeli imamo koncept vizualizacija podatkov .
argumenti ukazne vrstice v primeru kode Java
Vizualizacija podatkov : Vizualizacija podatkov je vizualni dostop do ogromnih količin podatkov, ki ste jih ustvarili po analitiki. Človeški um obdeluje vizualne slike in vizualne grafike so boljše kot v primerjavi s surovimi podatki. Vedno lahko razumemo tortni graf ali palični graf v primerjavi s surovimi številkami. Zdaj se morda sprašujete, kako lahko dosežete to vizualizacijo podatkov iz že analiziranih podatkov?
Na trgu so na voljo različna orodja za vizualizacijo podatkov:
Verjetno se vsi sprašujete, da je že toliko orodij, ki vam pomagajo doseči vizualizacijo podatkov in določeno količino analitike, zakaj bi šli z R?
Moja naslednja tema v blogu z vajami o R se ukvarja z vprašanjem 'zakaj R' in 'kdo uporablja R'.
R Vadnica: Zakaj R in kdo uporablja R?
Zakaj R?
R je programski in statistični jezik.
R se uporablja za analizo in vizualizacijo podatkov.
R je preprost in enostaven za učenje, branje in pisanje.
R je primer FLOSS (brezplačne programske opreme Libre in odprtokodne programske opreme), kjer lahko človek prosto distribuira kopije te programske opreme, prebere izvorno kodo, jo spremeni itd.
Kdo uporablja R?
- Urad za finančno zaščito potrošnikov za analizo podatkov uporablja R
- Statistiki John Deere uporabljajo R za modeliranje časovnih vrst in geoprostorsko analizo na zanesljiv in ponovljiv način.
- Bank of America za poročanje uporablja R.
- R je del tehnološkega sklopa, ki stoji za slavnim Foursquarejevim priporočilom.
- ANZ, četrta največja banka v Avstraliji, ki uporablja R za analizo kreditnega tveganja.
- Google uporablja R za napovedovanje gospodarske dejavnosti.
- Mozilla, fundacija, odgovorna za spletni brskalnik Firefox, uporablja R za vizualizacijo spletne dejavnosti.
Spodaj je nekaj domen, kjer se uporablja R:
Zdaj pa pojdimo naprej v R tutorial blog in namestite R.
R Vadnica: Namestitev R
Naj vas vodim skozi postopek namestitve R v vaš sistem. Samo sledite spodnjim korakom:
Korak 1 : Pojdite na povezavo https://cran.r-project.org/
2. korak : Prenesite in namestite R 3.3.3 v sistem.
Za boljše razumevanje si oglejte spodnji posnetek zaslona.
Če sledite zgornjim korakom, ste končali z namestitvenim delom R. Zdaj lahko neposredno začnete kodirati v R tako, da prenesete RStudio IDE. Če ga želite prenesti, sledite spodnjim korakom:
Korak 1 : Pojdite na povezavo https://www.rstudio.com/
2. korak : Prenesite in namestite Rstudio v vaš sistem.
Po namestitvi vsega ste pripravljeni na kodo!
R Vadnica za začetnike | R Vadnica za programiranje | Edureka
Nato pojdimo naprej v blogu R Tutorial in razumemo, kaj so upravljavci podatkov v R.
R Vadnica: Operaterji podatkov v R
Spodaj je naštetih 5 različnih vrst operaterjev:
- Aritmetični operaterji : Izvajajte aritmetične operacije, kot so seštevanje, odštevanje, množenje, deljenje itd.
- Operatorji dodelitve :Operatorji dodelitve se uporabljajo za dodelitev vrednosti. Na primer:
- Operator dodelitve =
Sintaksa: ime spremenljivke = vrednost
> x = 5 >x
Izhod: [1] 5
Operator dodelitve<-
Sintaksa: ime spremenljivke<- value> x<- 15 > x
Izhod: [1] 15
- Operator dodelitve<<-
Sintaksa: ime spremenljivke<<- value
> x<<- 2 > x
Izhod: [1] 2
- Operator dodelitve ->
Sintaksa: vrednost -> ime spremenljivke> 25 -> x > x
Izhod: [1] 25
3. Relacijski operater : Določa razmerje med dvema entitetama. Na primer:,<=,!= etc.
> xx! = 2
Izhod:[1] RES
4. Logični operaterji : Ti operaterji primerjajo dve entiteti in se običajno uporabljajo z logičnimi (logičnimi) vrednostmi, kot so &, | in!.
> x2 in 3
Izhod:[1] RES
5. Posebni operaterji : Ti operaterji se uporabljajo za določen namen in ne za logično računanje. Na primer:
- Ustvari niz števil v zaporedju za vektor.
> xx
Izhod: [1] 2 3 4 5 6 7 8
- % v% Ta operator se uporablja za ugotavljanje, ali element pripada vektorju.
Primer> xyy% v% x
Izhod: [1] TRUE
R Vadnica: Vrste podatkov
Podatkovni tipi se uporabljajo za shranjevanje informacij. V R nam spremenljivke ni treba razglasiti kot neke vrste podatkov. Spremenljivkam se dodelijo R-Objekti in podatkovni tip R-objekta postane podatkovni tip spremenljivke.V R je prisotnih predvsem šest vrst podatkov:
Pojdimo podrobneje o vsakem od njih:
Vektor : Vector je zaporedje podatkovnih elementov iste osnovne vrste. Primer:
vtr = (1, 3, 5, 7 9)
ali
vtr<- (1, 3, 5 ,7 9)
Obstaja 5 atomskih vektorjev, imenovanih tudi pet razredov vektorjev.
Seznam : Seznami so predmeti R, ki vsebujejo elemente različnih vrst, na primer & minus številke, nize, vektorje in drug seznam znotraj njih.
> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = seznam (n, s, TRUE) > x
Izhod -
[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] TRUE
Polja : Polja so R-podatkovni objekti, ki lahko hranijo podatke v več kot dveh dimenzijah. Za vhodne podatke jemlje vektorje in uporablja vrednosti v parametru dim za ustvarjanje matrike.
vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) rezultat<- array(c(vector1,vector2),dim = c(3,3,2))
Izhod -
,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15
Polja : Matrike so R objekti, v katerih so elementi razporejeni v dvodimenzionalni pravokotni postavitvi. Matrica se ustvari s pomočjo funkcije matrix (). Primer: matrika (podatki, nrow, ncol, byrow, dimnames) kje,
podatkov je vhodni vektor, ki postane podatkovni element matrike.
kako pretvoriti niz v datum
Nrow je število vrstic, ki jih je treba ustvariti.
ncol je število stolpcev, ki jih je treba ustvariti.
byrow je logičen namig. Če je TRUE, so vhodni vektorski elementi razporejeni po vrsticah.
dimname je imena, dodeljena vrsticam in stolpcem.
> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > MatIzhod :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16
Dejavniki : Faktorji so podatkovni objekti, ki se uporabljajo za kategorizacijo podatkov in njihovo shranjevanje kot ravni. Shranijo lahko tako nize kot cela števila. Uporabni so pri analizi podatkov za statistično modeliranje.
> podatki<- c('East','West','East','North','North','East','West','West“,'East“) > faktor_podatki<- factor(data) > faktor_podatki
Izhod :
[1] Vzhod Zahod Vzhod Sever Sever Vzhod Zahod Zahod Vzhod Ravni: vzhod severozahod
Podatkovni okviri : Podatkovni okvir je tabela ali dvodimenzionalna struktura, podobna matriki, v kateri vsak stolpec vsebuje vrednosti ene spremenljivke, vsaka vrstica pa en niz vrednosti iz vsakega stolpca.
> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > ocene = c (623,3,515,2,611,0,729,0,843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data
Izhod :
std_id oznake std_name 1 1 Rick 623,30 2 2 in 515.20 3 3 Michelle 611.00 4 4 Ryan 729,00 5 5 Gary 843.25
S tem pridemo do konca različnih vrst podatkov v R. Nato pojdimo naprej v blogu R Tutorial in razumemo še en ključni koncept - izjave o nadzoru pretoka.
R Vadnica: Izjave o nadzoru pretoka
Stavki nadzora pretoka igrajo zelo pomembno vlogo, saj vam omogočajo nadzor poteka izvajanja skripta znotraj funkcije. Najpogosteje uporabljeni stavki za nadzor pretoka so predstavljeni na spodnji sliki:
Zdaj pa o posameznih izmed njih razpravljajmo s primeri.
R Vadnica: Izbirne izjave
- Izjava o nadzoru : Ta kontrolni stavek ocenjuje en pogoj. Preprosto je, saj ima samo eno ključno besedo 'če', ki ji sledi pogoj in nato določen niz stavkov, ki jih je treba izvršiti, če je resničen. Za boljše razumevanje si oglejte spodnji diagram poteka:
V tem diagramu poteka bo koda odgovorila na naslednji način:
- Najprej bo vstopil v zanko, kjer preverja stanje.
- Če je pogoj izpolnjen, se izvede pogojna koda ali zapisani stavki.
- Če je pogoj napačen, se stavki prezrejo.
Spodaj je primer če stavka control v R. Poskusite zagnati ta primer v R Studio.
x = 2 ponovitev {x = x ^ 2 print (x) if (x> 100) {break}
Izhod:
[1] 4 [1] 16 [1] 256
- Če druga izjava o nadzoru :Izpitvrsta kontrolne izjaveovrednoti skupino pogojev in izbere trditve. Za boljše razumevanje si oglejte spodnji diagram poteka:
V tem diagramu poteka bo koda odgovorila na naslednji način:
- Najprej bo vstopil v zanko, kjer preverja stanje.
- Če je pogoj izpolnjen, se izvršijo prvi stavki 'if'.
- Če je pogoj neresničen, gre v pogoj 'else if' in če je resničen, se izvede koda 'else if'.
- Nazadnje, če je tudi koda 'else if' napačna, bo preusmerjena na kodo 'else' in se izvede. To pomeni, da če noben od teh pogojev ne drži, se izjava 'else' izvrši.
Spodaj je primer če potem stavka control v R. Poskusite zagnati ta primer v R Studio.
x5) {print ('x je večji od 5')} elseif (x == 5) {print ('x je enak 5')} else {print ('x ni večji od 5')}
Izhod:
[1] 'x je enako 5'
- Preklopi izjave : Ti kontrolni stavki se v osnovi uporabljajo za primerjavo določenega izraza z znano vrednostjo. Za boljše razumevanje si oglejte spodnji diagram poteka:
V tem diagramu poteka primera stikala se bo koda odzvala v naslednjih korakih:
- Najprej bo vstopil v ohišje stikala, ki ima izraz.
- Nato gre v pogoj 1. primera, preveri vrednost, posredovano pogoju. Če je res, se izvede blok Statement. Po tem se bo odklopil od ohišja stikala.
- V primeru, da je napačna, se preklopi na naslednji primer. Če je pogoj za primer 2 izpolnjen, bo izvedel stavek in se oddaljil od tega primera, sicer bo spet skočil na naslednji primer.
- Zdaj recimo, da niste navedli nobenega primera ali je uporabnik vnesel napačen vnos, potem bo šel v privzeti primer, kjer bo natisnil vaš privzeti stavek.
Spodaj je primer stavka switch v R. Poskusite zagnati ta primer v R Studio.
vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) )
Izhod:
[1] 275
R Vadnica: Izjave zanke
Zanke vam pomagajo ponoviti določen nabor dejanj, tako da vam jih ni treba izvajati večkrat. Predstavljajte si, da morate operacijo izvesti 10-krat, če začnete kodo pisati vsakič, se dolžina programa poveča in bi jo kasneje težko razumeli. Toda hkrati z uporabo zanke, če v izjavo napišem isti stavek, prihrani čas in olajša berljivost kode. Prav tako je bolj optimiziran glede učinkovitosti kode.
Na zgornji sliki je ponovi in ' medtem 'Stavki vam pomagajo izvajati določen nabor pravil, dokler pogoj ni izpolnjen,' za je stavek zanke, ki se uporablja, ko veste, kolikokrat želite ponoviti blok stavka. Če veste, da jo želite ponoviti 10-krat, boste nadaljevali z izjavo 'for', če pa niste prepričani, kolikokrat želite, da se koda ponovi, boste uporabili 'repeat' oz. zanka 'while'.
Pogovorimo se o vsakem od njih s primeri.
- Ponovite : Ponavljalna zanka pomaga vedno znova izvajati isti niz kode, dokler ni izpolnjen pogoj zaustavitve. Za boljše razumevanje si oglejte spodnji diagram poteka:
V zgornjem diagramu poteka bo koda odgovorila v naslednjih korakih:
- Najprej bo vnesel in izvedel niz kode.
- Nato bo preveril stanje, če je res, se bo vrnil in znova izvedel isto kodo, dokler ne bo mišljena kot napačna.
- Če se ugotovi, da je napačna, bo neposredno zapustila zanko.
- Medtem : Stavek while prav tako pomaga znova in znova izvajati isti niz kode, dokler ni izpolnjen pogoj zaustavitve. Za boljše razumevanje si oglejte spodnji diagram poteka:
V zgornjem diagramu poteka bo koda odgovorila v naslednjih korakih:
- Najprej bo preveril stanje.
- Če se ugotovi, da je resnična, bo izvedla nabor kode.
- Nato spet preveri stanje, če je res, bo znova izvedel isto kodo. Takoj, ko se ugotovi, da je pogoj napačen, takoj zapusti zanko.
Spodaj je primer stavka while v R. Poskusite zagnati ta primer v R Studio.
x = 2, medtem ko (x<1000) { x=x^2 print(x) }
Izhod:
4 16 256 65 536
Verjetno se sprašujete, kako se ti dve trditvi razlikujeta? Naj razjasnim vaš dvom!
Tu je glavna razlika med ponovitvijo in izjavo while ta, da se spremeni glede na vaše stanje. Medtem zanka v bistvu določa, kdaj boste vnesli zanko za izvajanje stavkov in ponovite zanka definira, kdaj zapustite zanko po izvedbi stavkov. Torej sta ti dve izjavi znani kot zanka za nadzor vstopa in zanke za nadzor izstopa. Tako se razlikujejo izjave while in repeat.
- Za zanko: Zanke se uporabljajo, ko morate večkrat izvesti blok kode. Za boljše razumevanje si oglejte spodnji diagram poteka:
V zgornjem diagramu poteka bo koda odgovorila v naslednjih korakih:
- Najprej gre za inicializacijo, pri kateri določite, kolikokrat želite, da se zanka ponovi.
- Nato preveri stanje. Če je pogoj izpolnjen, bo niz kode izvedel določeno število krat.
- Takoj, ko se ugotovi, da je pogoj napačen, takoj zapusti zanko.
Spodaj je primer izjave v R. Poskusite zagnati ta primer v R Studio.
vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) }
Izhod:
7 19 25 65 45
Nato se pomaknimo na zadnji sklop izjav v blogu R Tutorial, tj.
R Vadnica: Izjave o skokih
Izjava o prelomu : Stavki Break pomagajo pri prekinitvi programa in nadaljujejo nadzor do naslednjega stavka po zanki. Ti stavki se uporabljajo tudi v primeru preklopa. Za boljše razumevanje si oglejte spodnji diagram poteka:
V zgornjem diagramu poteka bo koda odgovorila v naslednjih korakih:
- Najprej bo vstopil v zanko, kjer preverja stanje.
- Če je pogoj zanke napačen, ta neposredno zapusti zanko.
- Če je pogoj resničen, bo preveril stanje prekinitve.
- Če je pogoj prekinitve resničen, obstaja iz zanke.
- Če je pogoj prekinitve napačen, bo izvedel stavke, ki ostanejo v zanki, in nato ponovil iste korake.
Spodaj je primer stavka za skok v R. Poskusite zagnati ta primer v R Studio.
x<- 1:5 for (val in x) { if (val == 3){ break } print(val) }
Izhod:
[1] 1 [1] 2
Naslednja izjava : Naslednji stavek se uporablja, kadar želite preskočiti trenutno ponovitev zanke, ne da bi jo končali. Naslednja izjava je precej podobna 'nadaljevanju' v drugem programskem jeziku. Za boljše razumevanje si oglejte spodnji diagram poteka:
V zgornjem diagramu poteka bo koda odgovorila v naslednjih korakih:
Najprej bo vstopil v zanko, kjer preverja stanje.
Če je pogoj zanke napačen, ta neposredno zapusti zanko.
Če je pogoj zanke resničen, bo izvedel stavke bloka 1.
Po tem bo preveril, ali je 'naslednji'. Če je prisoten, stavki po njem ne bodo izvedeni v isti ponovitvi zanke.
Če stavka ‘next’ ni, bodo izvedeni vsi stavki po tem.
Spodaj je primer naslednje izjave v R. Poskusite zagnati ta primer v R Studio.
for (i v 1:15) {if ((i %% 2) == 0) {next} print (i)}
Izhod:
1 3 5 7 9 11 13 15
To je konec bloga R tutorial. Upam, da ste jasni glede vsakega koncepta, o katerem sem razpravljal zgoraj. Ostanite z nami, moj naslednji blog bo na temi R, kjer bom z ex podrobno razložil še nekaj konceptov Rdovolj.
Zdaj, ko ste razumeli osnove R, si oglejte Edureka, zaupanja vredno podjetje za spletno učenje z mrežo več kot 250.000 zadovoljnih učencev, ki se širijo po vsem svetu. Edurekina podatkovna analitika z izobraževanjem R vam bo pomagala pridobiti znanje o programiranju R, manipulaciji s podatki, raziskovalni analizi podatkov, vizualizaciji podatkov, rudarjenju podatkov, regresiji, analizi sentimenta in uporabi R Studio za resnične študije primerov na področju maloprodaje, socialnih medijev.
Imate vprašanje za nas? Prosimo, omenite ga v oddelku za komentarje tega spletnega dnevnika »R Tutorial« in v najkrajšem možnem času se vam bomo oglasili.