Modeliranje tehnik v poslovni analitiki z R



V spletnem dnevniku je kratek uvod tehnike modeliranja v poslovni analitiki z R.

Različne tehnike modeliranja:

Vsak problem lahko razdelimo na manjše procese:





Razvrstitev - je, kjer podatke razvrščamo. Npr. bolezni vse bolezni kažejo določeno vedenje in jih lahko dodatno razvrstimo.

Na primer: bolezni, ki zmanjšujejo imunost, bolezni, ki povzročajo glavobol itd.



Regresija - vključuje iskanje povezave med več spremenljivkami.

Na primer: kako je teža človeškega bitja povezana z njegovo višino.

AnomolijaZaznavanje - je v osnovi nihanje.



Na primer: V primeru visoke ali nizke napetosti.

Drug primer bi lahko vključeval urejeno vedenje, ki vključuje vožnjo po desni ali levi strani glede na državo. Tu je anomolija nekdo, ki vozi od nasprotnega.

Drug primer je lahko vdor v omrežje. Tu se overjeni uporabnik prijavi na spletno mesto vašega podjetja, in če se nekdo, ki se neverificira, prijavi, je toAn0moly.

Pomen atributa - V bistvu daje več lastnosti, kot so višina, teža, temperatura, srčni utrip. Treba je omeniti, da so vsi ti atributi pomembni za nalogo.

Na primer: Nekdo poskuša napovedati, kdaj bo oseba prišla v pisarno. Vsak atribut ima pomembno vlogo, vendar niso vsi atributi pomembni.

Pridružitvena pravila - Preprosteje je analizirati ali predvideti naslednje vedenje, kjer se vrti okoli priporočevalnega mehanizma.

Na primer: oseba, ki kupuje kruh, lahko kupi tudi mleko. Če analiziramo preteklo nakupovalno vedenje, so vsi predmeti v košarici povezani. V tem primeru lahko obstaja verjetnost, da bo tisti, ki kupuje kruh, kupil tudi mleko.

Grozdanje - To je ena najstarejših tehnik v statistiki. Pravzaprav je vedno mogoče modelirati kateri koli problem, pa naj bo to razvrščanje ali združevanje v skupine, kar pomeni združevanje podobnih entitet.

Na primer:

1) Vzemite košaro jabolk in pomaranč, v kateri lahko ločimo jabolka od pomaranč.

2) Pomemben primer uporabe grozdov je zdravstveno varstvo. Skoraj vse statistike in analize so se začele s primeri uporabe zdravstvenega varstva. Če gremo globlje, obstaja grozdni izraz, imenovan kohorte (ljudje s podobnimi boleznimi), tako da jih je mogoče preučevati ločeno od obstoječih strank. Na primer, če 10 ljudi trpi zaradi vročine in še 10 ljudi zaradi glavobola, bomo ugotovili, kaj je skupno med njimi, in ustvarili zdravila.

Izvleček funkcije - Pri natančnosti ekstrakcije lastnosti so veljavnost in okvare zelo pomembne. Z drugimi besedami, ekstrakcijo lastnosti lahko označimo kot prepoznavanje vzorcev.

Na primer:

V Googlovem iskanju uporabnik, ko vnese izraz, prikaže rezultate. Zdaj je pomembno vprašanje, kako je vedel, katera stran je ustrezna in nepomembna za izraz? Na to lahko odgovorimo z ekstrakcijo funkcij in prepoznavanjem vzorcev, kjer doda vidne lastnosti. Recimo, da je dana fotografija, nekatere kamere zaznajo obraze, poudarijo obraz, da dobijo čudovite slike, ki uporablja tudi prepoznavanje funkcij.

Nadzorovano učenje vs Nenadzorovano učenje

do) Kategorija napovedovanja - Tehnike vključujejo regresijo, logistiko, nevronske mreže in drevesa odločanja. Nekateri primeri vključujejo odkrivanje prevar (kjer se računalnik nauči in napove naslednjo prevaro iz prejšnje zgodovine prevar). Pri nenadzorovanem učenju ni mogoče predvideti s primeri, saj ni zgodovinskih podatkov.

b) Kategorija razvrščanja - Na primer, ne glede na to, ali je transakcija lažna ali ne, vstopi v klasifikacijsko kategorijo. Tu vzamemo zgodovinske podatke in jih razvrstimo po drevesih odločitev ali v primeru, da zgodovinskih podatkov sploh ne vzamemo, potem neposredno začnemo s podatki in poskušamo izkoristiti funkcije sami. Na primer, če moramo poznati zaposlene, ki bodo verjetno zapustili organizacijo ali verjetno ostali. V primeru, da gre za novo organizacijo, kjer ne moremo uporabljati preteklih podatkov, lahko vedno uporabimo grozde za pridobivanje podatkov.

razlika med podiplomskim in magistrskim študentom

c) Kategorija raziskovanja - To je neposredna metoda, ki predstavlja, kaj pomenijo veliki podatki. Pri nenadzorovanem učenju se imenuje glavne komponente in združevanje v skupine.

d) Kategorija afinitete - tu je vključenih več elementov, kot so navzkrižna prodaja / prodaja, analiza tržne košarice. V analizi košarice ni nadzorovanega učenja, saj ni zgodovinskih podatkov. Podatke torej vzamemo neposredno in najdemo povezave, zaporedje in faktorsko analizo.

Imate vprašanje za nas? Omenite jih v oddelku za komentarje in javili se vam bomo.

Sorodne objave: