SQL za podatkovno znanost: rešitev na enem mestu za začetnike



Ta objava v blogu o SQL za Data Science vam bo pomagala razumeti, kako lahko SQL uporabljamo za shranjevanje, dostop in pridobivanje podatkov za analizo podatkov.

Odkar je Data Science uvrščen na prvo mesto najbolj najobetavnejšega dela v tej dobi, se vsi skušamo pridružiti dirki . Ta objava v blogu o SQL za Data Science vam bo pomagala razumeti, kako lahko SQL uporabljamo za shranjevanje, dostop in pridobivanje podatkov za analizo podatkov.

Tu je seznam tem, ki bodo zajeto v tem blogu:





    1. Zakaj je SQL potreben za podatkovno znanost?
    2. Kaj je SQL?
    3. Osnove SQL
    4. Namestitev MySQL
    5. Hands-On

Zakaj je SQL potreben za podatkovno znanost?

Ste vedeli, da vsak dan ustvarimo več kot 2,5 kvintiljona bajtov podatkov? Ta hitrost pridobivanja podatkov je razlog za priljubljenost vrhunskih tehnologij, kot je Podatkovna znanost , , in tako naprej.

Pridobivanje koristnih vpogledov iz podatkov je tisto, kar imenujemo Data Science. Podatkovna znanost vključuje pridobivanje, obdelavo in analizo ton podatkov. Trenutno tisto, kar potrebujemo, je ki se lahko uporablja za shranjevanje in upravljanje te velike količine podatkov.



Kaj je podatkovna znanost - Edureka

Tu je Prihaja SQL.

SQL lahko uporabljamo za shranjevanje, dostop in pridobivanje ogromnih količin podatkov, da lahko celoten postopek Data Science izvedemo bolj gladko.



Kaj je SQL?

SQL kar je kratica za Structured Query Language je jezik za poizvedbe, namenjen upravljanju relacijskih baz podatkov.

Kaj pa je pravzaprav relacijska baza podatkov?

Relacijska baza podatkov je skupina natančno določenih tabel, iz katerih je mogoče dostopati, urejati, posodabljati podatke itd., Ne da bi morali spreminjati tabele baze podatkov. SQL je standard (API) za relacijske zbirke podatkov.

Če se vrnemo v SQL, lahko programiranje SQL uporabljamo za izvajanje več dejanj nad podatki, kot so poizvedovanje, vstavljanje, posodabljanje, brisanje zapisov baze podatkov. Primeri relacijskih baz podatkov, ki uporabljajo SQL, vključujejo MySQL Database, Oracle itd.

Če želite izvedeti več o SQL, si lahko ogledate naslednji blogi:

  1. Razumevanje tipov podatkov SQL - vse, kar morate vedeti o vrstah podatkov SQL
  2. USTVARI TABELO v SQL - Vse, kar morate vedeti o ustvarjanju tabel v SQL

Preden začnemo z predstavitvijo SQL, se seznanimo z osnovnimi ukazi SQL.

Osnove SQL

SQL ponuja nabor preprostih ukazov za spreminjanje podatkovnih tabel, poglejmo si nekaj osnovnih ukazov SQL:

  • USTVARI BAZO PODATKOV - ustvari novo bazo podatkov
  • USTVARI TABELO - ustvari novo tabelo
  • VSTAVITE V - vstavi nove podatke v bazo podatkov
  • IZBERI - izvleče podatke iz baze podatkov
  • NADGRADNJA - posodablja podatke v zbirki podatkov
  • IZBRIŠI - izbriše podatke iz baze podatkov
  • ALTER BAZE PODATKOV - spremeni bazo podatkov
  • ALTER TABLE - spremeni tabelo
  • KAPITALNA MIZA - izbriše tabelo
  • USTVARI KAZALO - ustvari indeks za iskanje elementa
  • KAPITALNI INDEKS - izbriše indeks

Za boljše razumevanje SQL-a namestite MySQL in si oglejte, kako se lahko igrate s podatki.

Namestitev MySQL

Namestitev MySQL je preprosta naloga. Tukaj je vodnik po korakih vam bo pomagal namestiti MySQL v sistem.

Ko končate z namestitvijo MySQL, sledite spodnjemu razdelku za preprost demo, ki vam bo pokazal, kako lahko vstavljate, manipulirate in spreminjate podatke.

kaj je chef v devopsu

SQL za podatkovno znanost - predstavitev MySQL

V tej predstavitvi bomo videli, kako ustvariti baze podatkov in jih obdelati. To je predstavitev na začetni ravni za začetek analize podatkov v SQL.

Začnimo torej!

1. korak: Ustvarite bazo podatkov SQL

Baza podatkov SQL je skladišče za shranjevanje, v katerem je mogoče podatke shraniti v strukturirani obliki. Zdaj pa ustvarimo bazo podatkov z uporabo MySQL :

USTVARI BAZO PODATKOV edureka UPORABI edureka

V zgornji kodi sta dva ukaza SQL:

Opomba : Ukazi SQL so definirani z velikimi tiskanimi črkami, s podpičjem pa se konča ukaz SQL.

tabela po korakih
  1. USTVARI DATABASO: Ta ukaz ustvari bazo podatkov, imenovano „edureka“

  2. UPORABA: Ta ukaz se uporablja za aktiviranje baze podatkov. Tu aktiviramo bazo podatkov „edureka“.

2. korak: Ustvarite tabelo z zahtevanimi podatkovnimi funkcijami

Ustvarjanje tabele je tako enostavno kot ustvarjanje baze podatkov. Določiti morate samo spremenljivke ali značilnosti tabele z njihovimi vrstami podatkov. Poglejmo, kako je to mogoče storiti:

Ustvarite igrače za mizo (TID INTEGER NULL PRIMARNI KLJUČ AUTO_INCREMENT, ime_besedila TEXT, cena INTEGER, količina INTEGER)

V zgornjem delčku kode se zgodijo naslednje stvari:

  1. Z ukazom 'Ustvari tabelo' ustvarite tabelo, imenovano igrače.
  2. Tabela igrač vsebuje 4 značilnosti, in sicer TID (ID transakcije), Ime_izdelka, Cena in količina.
  3. Vsaka spremenljivka je definirana s pripadajočimi tipi podatkov.
  4. Spremenljivka TID je navedena kot primarni ključ. Primarni ključ v bistvu označuje spremenljivko, ki lahko shrani edinstveno vrednost.

Podrobnosti definirane tabele lahko preverite z naslednjim ukazom:

OPISI igrače

3. korak: vstavljanje podatkov v tabelo

Zdaj, ko smo ustvarili tabelo, jo zapolnimo z nekaterimi vrednostmi. Prej v tem blogu sem omenil, kako lahko podatke dodate v tabelo z enim samim ukazom, tj. INSERT INTO.

Poglejmo, kako se to naredi:

VSTAVITE V VREDNOSTI igrač (NULL, 'Vlak', 550, 88) INSERT INTO VREDNOTICE igrač (NULL, 'Hotwheels_car', 350, 80) VSTAVITE V VREDNOSTI igrač (NULL, 'Magic_Pencil', 70, 100) VSTAVITE V VREDNOSTI igrač ( NULL, 'Dog_house', 120, 54) VSTAVITE V VREDNOSTI igrač (NULL, 'Skateboard', 700, 42) VSTAVITE V VREDNOSTI igrač (NULL, 'GI Joe', 300, 120)

V zgornji delček kode smo v našo tabelo 'igrače' preprosto vstavili 6 opažanj z ukazom INSERT INTO. Za vsako opazovanje sem v oklepajih določil vrednost vsake spremenljivke ali značilnosti, ki je bila definirana med ustvarjanjem tabele.

Spremenljivka TID je nastavljena na NULL, saj se samodejno poveča od 1.

Zdaj pa prikažimo vse podatke, ki so prisotni v naši tabeli. To lahko storite z uporabo spodnjega ukaza:

IZBERI * IZ igrač


4. korak: Spremenite vnose podatkov

Recimo, da ste se odločili za povišanje cene G.I. Joe, saj vam prinaša veliko strank. Kako bi posodobili ceno spremenljivke v zbirki podatkov?

Preprosto je, uporabite spodnji ukaz:

POSODOBITI igrače SET Cena = 350 KJE TID = 6

Ukaz UPDATE vam omogoča spreminjanje vseh vrednosti / spremenljivk, shranjenih v tabeli. Parameter SET vam omogoča, da izberete določeno funkcijo, parameter WHERE pa se uporablja za identifikacijo spremenljivke / vrednosti, ki jo želite spremeniti. V zgornjem ukazu sem posodobil ceno vnosa podatkov, katerega TID je 6 (G.I. Joe).

Zdaj pa si oglejmo posodobljeno tabelo:

IZBERI * IZ igrač

Prav tako lahko spremenite, kaj želite, da se prikaže, tako da se preprosto sklicujete na stolpce, ki si jih želite ogledati. Na primer, spodnji ukaz bo prikazal samo ime igrače in njeno ceno:

IZBERI ime_izdelka, cena IZ igrač

5. korak: Pridobivanje podatkov

Ko vstavite podatke in jih spremenite, je končno čas, da podatke izvlečete in pridobite v skladu s poslovnimi zahtevami. Tu je mogoče pridobiti podatke za nadaljnjo analizo in modeliranje podatkov.

Upoštevajte, da je preprost primer za začetek uporabe SQL-a, vendar so v resničnih scenarijih podatki veliko bolj zapleteni in veliki. Kljub temu ukazi SQL še vedno ostajajo enaki in prav zaradi tega je SQL tako preprost in razumljiv. Zapletene nabore podatkov lahko obdeluje z naborom preprostih ukazov SQL.

Zdaj poiščimo podatke z nekaj spremembami. Oglejte si spodnjo kodo in poskusite razumeti, kaj počne, ne da bi pogledali izhodne podatke:

IZBERITE * IZ igrač 2

Uganili ste! Prikaže prvi dve ugotovitvi, ki sta prisotni v moji tabeli.

Poskusimo kaj bolj zanimivega.

IZBERITE * OD igrač Naročilo po ceni ASC

Kot je prikazano na sliki, so vrednosti razporejene glede na naraščajoči vrstni red spremenljivke cene. Kaj bi storili, če želite iskati tri najpogosteje kupljene predmete?

V resnici je povsem preprosto!

IZBERITE * IZ igrač Naročilo po količini DESC LIMIT 3

Poskusimo še eno.

IZBERITE * IZ igrač, KJER Cena> 400 NAROČI PO CENI ASC


Ta poizvedba izvleče podrobnosti igrač, katerih cena je večja od 400, in razvrsti izhod po naraščajočem vrstnem redu cene.

Tako lahko podatke obdelate z uporabo SQL. Zdaj, ko poznate osnove SQL za Data Science, sem prepričan, da vas zanima več. Tukaj je nekaj blogov za začetek:

  1. Kaj je podatkovna znanost? Začetniški vodnik po znanosti o podatkih
  2. Vadnica za MySQL - vodnik za začetnike za učenje MySQL

Če se želite vpisati na celoten tečaj o umetni inteligenci in strojnem učenju, ima Edureka posebej kurirano s tem boste usposobljeni za tehnike, kot so nadzorovano učenje, nenadzorovano učenje in obdelava naravnega jezika. Vključuje usposabljanje o najnovejših dosežkih in tehničnih pristopih na področju umetne inteligence in strojnega učenja, kot so globoko učenje, grafični modeli in učenje okrepitve.

html oznaka za prelom vrstice