Temeljne znanstvene spretnosti



Ta blog opisuje temeljne spretnosti Data Scientist Skills skupaj s kontrolnim seznamom veščin, potrebnih, da postanete odličen in učinkovit znanstvenik. Preberite >>>

Dva analitika iz LinkedIna sta leta 2008 skovala izraz 'podatkovni znanstvenik'. Poskušala sta le opisati, kaj počneta, tj. Poslovno vrednost izpeljati iz množičnih podatkov, ki jih je ustvarila njihova spletna stran. V tem procesu so na koncu poimenovali naziv delovnega mesta, ki bo v prihodnjih letih videl neverjetno povpraševanje in ga celo imenovali 'Najbolj seksi služba 21-ihststoletja. '

Zdaj organizacije, ki štejejo „podatke“ za dragoceno sredstvo, iščejo te strokovnjake za podatke ali „znanstvenike“, ki bi jih vodili v prihodnost.





Torej, kaj je potrebno, da postaneš odličen znanstvenik za podatke? ... Različni nabori spretnosti!

Kratek pregled osnovnih znanj podatkovnega znanstvenika.



Proces znanosti o podatkih vključuje tri stopnje.

družina stolpcev kasandra vs tabela
  • Zajem podatkov
  • Analiza podatkov
  • Predstavitev

Podrobneje si oglejmo vlogo podatkovnega znanstvenika v vsaki od teh faz.

Zajem podatkov



  • Spretnosti programiranja in baze podatkov

Prvi korak podatkovnega rudarjenja je zajemanje pravih podatkov. Če želite biti podatkovni znanstvenik, je zelo pomembno, da poznate orodja in tehnologije, zlasti odprtokodne, kot so Hadoop, Java, Python, C ++, in tehnologije baz podatkov, kot so SQL, NoSQL, HBase in tako naprej.

okrogli program v c
  • Poslovna domena in strokovnost

Podatki se razlikujejo glede na posel. Zato je za razumevanje poslovnih podatkov potrebno strokovno znanje, ki pride samo z delom v določeni podatkovni domeni.

Na primer: podatki, zbrani s področja medicine, se bodo popolnoma razlikovali od podatkov maloprodajne trgovine z oblačili.

  • Modeliranje podatkov, skladišče in nestrukturirane spretnosti podatkov

Organizacije zbirajo ogromno podatkov prek različnih virov. Podatki, zajeti na ta način, so nestrukturirani in jih je treba organizirati pred analizo. Zato mora biti podatkovni znanstvenik usposobljen za modeliranje nestrukturiranih podatkov.

Analiza podatkov

  • Statistične veščine orodij

Bistvena veščina podatkovnega znanstvenika je vedeti, kako uporabljati statistična orodja, kot so R, Excel, SAS itd. Ta orodja so potrebna za mletje zajetih podatkov in njihovo analizo.

  • Matematične spretnosti

Samo znanje računalništva ne zadostuje za to, da bi se ukvarjali s podatki. Profil podatkovnega znanstvenika zahteva nekoga, ki lahko razume obsežne algoritme strojnega učenja in programiranje, hkrati pa je usposobljen statistik. Za to potrebujemo strokovno znanje iz drugih znanstvenih in matematičnih disciplin, razen računalniških jezikov.

Predstavitev

  • Spretnosti orodij za vizualizacijo

Morda boste lahko zbrali in modelirali zbrane podatke, vendar jih lahko vizualizirate?

Če želite biti uspešen podatkovni znanstvenik, bi morali imeti možnost dela z nekaterimi orodji za vizualizacijo podatkov, ki vizualno predstavljajo analize podatkov. Nekateri med njimi vključujejo R, Flare, HighCharts, AmCharts, D3.js, Processing in Google Visualization API itd.

A to še ni konec! Če si res želite postati podatkovni znanstvenik, morate imeti tudi naslednje veščine:

  • Komunikacijske sposobnosti: Statistični podatki in Excel so zapleteni. Podatkovni znanstveniki bi morali biti sposobni predstaviti podatke tako, da rezultate sporočajo poslovnim uporabnikom.
  • Poslovne spretnosti : Podatkovni znanstveniki bodo morali igrati več vlog. Morali bi komunicirati z različnimi ljudmi v organizaciji. Zato nam bo v veliko pomoč močno poslovno znanje, ki vključuje komunikacijo, načrtovanje, organiziranje in upravljanje. To vključuje razumevanje poslovnih in aplikativnih zahtev ter ustrezno razlago informacij. Prav tako bi moral na splošno razumeti ključne izzive v tej panogi in se zavedati finančnih razmerij za boljše odločanje. Bottom line, podatkovni znanstvenik, ki misli tudi 'posel'.
  • Spretnosti reševanja problemov: To se zdi očitno, saj gre pri znanosti o znanosti za reševanje problemov. Učinkovit podatkovni znanstvenik si mora vzeti čas in natančno preučiti težavo ter najti izvedljivo rešitev, ki bo ustrezala uporabniku.
  • Spretnosti napovedovanja: Podatkovni znanstvenik bi moral biti tudi učinkovit napovednik. Moral bi imeti široko znanje o algoritmih, da izbere pravega, ki se pravilno prilega podatkovnemu modelu. To vključuje določeno mero ustvarjalnosti za pametno uporabo in predstavitev podatkov.
  • Vdiranje: Vem, da se sliši zastrašujoče, toda z različnimi hekerskimi veščinami, kot so manipulacija z besedilnimi datotekami v ukazni vrstici, razumevanje vektoriziranih operacij in algoritmično razmišljanje, boste postali boljši podatkovni znanstvenik.

Če pogledamo zgornje sklope spretnosti, je jasno, da biti Data Scientist ne pomeni le vedeti vsega o podatkih. Gre za zaposlitveni profil z združitvijo podatkovnih veščin, matematičnih veščin, poslovnih spretnosti in komunikacijskih veščin. Z vsemi temi spretnostmi lahko Data Scientistja upravičeno imenujemo Rock zvezda na področju IT.

Kontrolni seznam, da postanete odličen in učinkovit podatkovni znanstvenik:

Obravnavali smo veščine, ki so potrebne za pridobitev podatkovnega znanstvenika. Velika razlika je v tem, da samo postaneš podatkovni znanstvenik in postaneš super in učinkovit znanstvenik. Naslednje spretnosti in zgoraj omenjene spretnosti vas ločijo od običajnega ali celo povprečnega podatkovnega znanstvenika.

anonimni tečaj v javi]
  • Matematične spretnosti - Kalkulacije, matrične operacije, numerična optimizacija, stohastične metode itd.
  • Statistične spretnosti - Regresijski modeli, tress, klasifikacije, diagnostika, uporabljena statistika itd.
  • Komunikacija - Vizualizacija, predstavitev in pisanje.
  • Zbirka podatkov - Poleg CouchDB tudi znanje v netradicionalnih zbirkah podatkov, kot sta MongoDB in Vertica.
  • Programski jeziki - Prašič, panj, Java, Python itd.
  • Obdelava naravnega jezika in Podatkovno rudarjenje.

Edureka ima posebej kurirano ki vam pomaga pridobiti strokovno znanje o algoritmih strojnega učenja, kot so grozdenje K-Means, drevesa odločanja, naključni gozd, naivni Bayes. Spoznali boste koncepte statistike, časovnih vrst, rudarjenja besedil in uvod v globoko učenje. Kmalu se začenjajo nove serije za ta tečaj !!