Vadnica za Python Seaborn: Kaj je Seaborn in kako jo uporabiti?



Vadnica za Python Seaborn ob razliki med seaborn in matplotlib. Spoznajte tudi različne funkcije in prilagoditve, ki so na voljo v Seaborn.

Python je skladišče številnih izjemno zmogljivih knjižnic in okvirov. Med njimi je tudi Seaborn, ki je prevladujoča vizualizacija podatkov knjižnico, ki programerjem zagotavlja še en razlog za dokončanje . V tej vadnici za Python Seaborn boste uporabili vse sposobnosti vizualizacije podatkov z uporabo Seaborna.

Preden nadaljujemo, si oglejmo vse teme razprav v tem članku:





Začnimo najprej z obrazložitvijo pomena Pythona Seaborna.

Zakaj uporabljati Python Seaborn?

Kot smo že omenili, se knjižnica Python Seaborn uporablja za lažjo zahtevno nalogo vizualizacije podatkov in temelji na njej . Seaborn omogoča ustvarjanje statističnih grafik s pomočjo naslednjih funkcij:



razlika med final final in finalize v javi
  • API, ki temelji na naborih podatkov in omogoča primerjavo med več spremenljivke

  • Podpira mreže z več ploskvami, ki nato olajšajo gradnjo kompleksnih vizualizacij

  • Na voljo so enobarvne in dvojne vizualizacije za primerjavo med podskupinami podatkov



  • Razpoložljivost različnih barvnih palet za razkrivanje različnih vrst vzorcev

  • Ocene in ploskve samodejno

Če ste se torej spraševali, zakaj uporabljati Seaborn, ko že imate Matplotlib, je tukaj odgovor nanj.

Python Seaborn vs Matplotlib:

'Če Matplotlib' skuša olajšati lahke in težke stvari ', Seaborn poskuša olajšati tudi natančno določen nabor težkih stvari' - Michael Waskom (Creator of Seaborn).
Dejansko je Matplotlib dober, Seaborn pa boljši. V bistvu sta dve pomanjkljivosti Matplotliba, ki jih Seaborn odpravi:

  1. Matplotlib je mogoče prilagoditi, vendar je težko ugotoviti, katere nastavitve so potrebne, da bi bile ploskve privlačnejše. Po drugi strani pa Seaborn ponuja številne prilagojene teme in vmesnike na visoki ravni za rešitev te težave.

  2. Pri delu z Pande , Matplotlib ne deluje dobro, ko gre za obdelavo podatkovnih okvirjev, medtem ko funkcije Seaborna dejansko delujejo na podatkovnih okvirjih.

Kako namestiti Seaborn?

Za namestitev knjižnice Python Seaborn lahko uporabite naslednje ukaze glede na platformo, ki jo uporabljate:

pip namestite seaborn

ali

conda namestiti seaborn

Ko je ta nameščen, samo namestite pakete in knjižnice, od katerih je odvisen Seaborn.

Namestitev odvisnosti Python Seaborn:

Obvezne odvisnosti za morske rojene so:

Obstaja tudi ena priporočena odvisnost, ki je:

  • državni modeli

Za namestitev teh knjižnic lahko uporabite iste ukaze, kot so bili prej prikazani za Seaborn z njihovimi imeni. Po namestitvi jih je mogoče enostavno uvoziti. Seaborn vam omogoča nalaganje katerega koli nabora podatkov iz uporabljati load_dataset () funkcijo. Vse razpoložljive nabore podatkov si lahko ogledate tudi s funkcijo get_dataset_names (), kot sledi:

PRIMER:

uvozi seaborn kot sns sns.get_dataset_names ()

To bo vrnilo seznam vseh razpoložljivih naborov podatkov.
Zdaj, ko ste vzpostavili svoje okolje za delo z Seaborn, pojdimo naprej, da vidimo, kako uporabljati njegove funkcije risanja v .

Funkcije risanja Seaborn

Vizualizacija statističnih razmerij:

Postopek razumevanja razmerij med spremenljivkami nabora podatkov in tega, kako so ta razmerja odvisna od drugih spremenljivk, je znan kot statistična analiza. Poglejmo zdaj poglobljeno funkcije, potrebne za to:

ponovna plota ():

To je funkcija na ravni figure, ki uporablja dve drugi funkciji osi za vizualizacijo statističnih razmerij, ki sta:

  • graf raztrosa()
  • lineplot ()

Te funkcije lahko določite s pomočjo parametra 'kind' relplot (). V primeru, da je podan ta parameter, je potreben privzeti, ki je scatterplot (). Preden začnete pisati kodo, obvezno uvozite potrebne knjižnice, kot sledi:

uvoz numpy kot np uvoz pand kot pd uvoz matplotlib.pyplot kot plt uvoz seaborn kot sns sns.set (style = 'darkgrid')

Upoštevajte, da je tudi atribut sloga prilagodljiv in ima lahko katero koli vrednost, kot so temna mreža, klopi itd., O čemer bom razpravljal kasneje v oddelku o estetiki ploskve. Oglejmo si zdaj majhen primer:

PRIMER:

f = sns.load_dataset ('leti') sns.relplot (x = 'potniki', y = 'mesec', podatki = f)

IZHOD:

Leti1-Vadnica Python Seaborn-Edureka

Kot lahko vidite, so točke narisane v 2-dimenzijah. Lahko pa dodate še eno dimenzijo s semantiko „odtenek“. Oglejmo si primer istega:

PRIMER:

f = sns.load_dataset ('leti') sns.relplot (x = 'potniki', y = 'mesec', odtenek = 'leto', podatki = f)

Videli boste naslednji izhod:

IZHOD:

Obstaja pa še veliko prilagoditev, ki jih lahko preizkusite, na primer barve, slogi, velikost itd. Naj v naslednjem primeru samo pokažem, kako lahko spremenite barvo:

PRIMER:

sns.set (style = 'darkgrid') f = sns.load_dataset ('poleti') sns.relplot (x = 'potniki', y = 'mesec', odtenek = 'leto', paleta = 'ch: r = - .5, l = .75 ', podatki = f)

IZHOD:

lineplot ():

Ta funkcija vam bo omogočila risanje neprekinjene črte za vaše podatke. To funkcijo lahko uporabite tako, da spremenite parameter 'kind', kot sledi:

PRIMER:

a = pd.DataFrame ({'Dan': [1,2,3,4,5,6,7], 'Živila': [30,80,45,23,51,46,76], 'Oblačila' : [13,40,34,23,54,67,98], 'Pripomočki': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'Oblačila', kind = 'line', data = a) g.fig.autofmt_xdate ()

IZHOD:

Privzeto za lineplot je y kot funkcija x. Vendar pa ga lahko spremenite, če želite. Obstaja veliko več možnosti, ki jih lahko preizkusite še naprej.

Zdaj pa si oglejmo, kako izrisati kategorične podatke.

Izris s kategoričnimi podatki:

Ta pristop se pojavi v sliki, ko je naša glavna spremenljivka nadalje razdeljena na ločene skupine (kategorične). To lahko dosežemo s funkcijo catplot ().

catplot ():

To je funkcija na ravni figure, kot je relplot (). Zaznamujejo ga lahko tri družine funkcij ravni osi, in sicer:

  1. Scatterplots - Sem spadajo stripplot (), swarmplot ()

    preobremenitev metode v primerjavi s preglasitvijo metode
  2. Distribucijske ploskve - ki so boxplot (), violinplot (), boxenplot ()

  3. Ocenite ploskve - in sicer pointplot (), barplot (), countplot ()

Vzemimo zdaj nekaj primerov, da to dokažemo:

PRIMER:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', podatki = a)

IZHOD:

Kot lahko vidite, v zgornjem primeru nisem nastavil parametra 'kind'. Zato je graf vrnil kot privzeti razpršeni načrt. Za spreminjanje grafa lahko po potrebi določite katero koli funkcijo osi osi. Vzemimo tudi primer tega:

PRIMER:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'violina', podatki = a)

IZHOD:

Zgornji izhod prikazuje ploskev violine za nabor podatkov z nasveti. Zdaj pa poskusimo najti, kako vizualizirati distribucijo nabora podatkov.

Vizualizacija distribucije nabora podatkov:

To se v bistvu ukvarja z razumevanjem naborov podatkov s kontekstom, da je enovariaten ali bivariaten. Preden začnete s tem, samo uvozite naslednje:

uvoz numpy kot np uvoz pande kot pd uvoz seaborn kot sns uvoz matplotlib.pyplot kot plt iz scipy uvoz statistika sns.set (color_codes = True)

Ko je to končano, lahko nadaljujete z načrtovanjem univariatne in bivariatne distribucije.

Izris distribucij Univariate:

Če jih želite izrisati, lahko uporabite funkcijo distplot (), kot sledi:

PRIMER:

a = np.random.normal (loc = 5, velikost = 100, lestvica = 2) sns.distplot (a)

IZHOD:

Kot lahko vidite v zgornjem primeru, smo pripravili graf za spremenljivko a, katere vrednosti generira funkcija normal () s pomočjo distplot.

Načrtovanje bivariatnih porazdelitev:

To se pokaže, ko imate dve naključni neodvisni spremenljivki, kar ima za posledico verjeten dogodek. Najboljša funkcija za risanje te vrste grafov je jointplot (). Zdaj narišimo bivariatni graf z uporabo jointplot ().

PRIMER:

x = pd.DataFrame ({'Dan': [1,2,3,4,5,6,7], 'Živila': [30,80,45,23,51,46,76], 'Oblačila' : [13,40,34,23,54,67,98], 'Pripomočki': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Dan': [8,9,10,11,12,13,14], 'Živila': [30,80,45,23,51,46, 76], 'Oblačila': [13,40,34,23,54,67,98], 'Pripomočki': [12,32,27,56,87,54,34]}, indeks = [8,9 , 10,11,12,13,14]) pomeni, cov = [0, 1], [(1, .5), (.5, 1)] podatki = np.random.multivariate_normal (povprečje, cov, 200 ) s sns.axes_style ('bela'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

IZHOD:

Zdaj, ko ste razumeli različne funkcije Pythona Seaborna, nadaljujmo z gradnjo strukturiranih mrež z več ploskvami.

Večploske mreže:

Python Seaborn vam omogoča načrtovanje več mrež vzporedno. To so v bistvu grafi ali grafi, ki so narisani z uporabo istega merila in osi za lažjo primerjavo med njimi. To pa programerju pomaga, da hitro razlikuje med ploskvami in pridobi veliko količino informacij.

Za risanje teh grafov upoštevajte naslednji primer funkcije facetgrid ().

vloge in odgovornosti linux skrbnika

PRIMER:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'vrsta') b.map (plt.hist, 'sepal_length')

IZHOD:

Zgornji izhod jasno prikazuje primerjavo nasvetov med kosilom in večerjo. Načrtujete lahko tudi s funkcijo PairGrid, če imate par spremenljivk za primerjavo. Razmislite o naslednjem primeru.

PRIMER:

sns.set (style = 'kljukice') a = sns.load_dataset ('poleti') b = sns.PairGrid (a) b.map (plt.scatter)

IZHOD:

Kot lahko vidite, zgornji rezultat na različne načine jasno primerja leto in število potnikov.

Seaborn omogoča tudi prilagoditve glede estetike, o čemer bomo nadalje govorili.

Estetika plota:

Ta segment vadnice Python Seaborn se ukvarja s tem, kako narediti naše ploskve bolj privlačne in čudovite.

Python Seaborn Figure-Estetika:

Prva funkcija, o kateri bom razpravljal, je nastavljena (). Že prej uporabljam parameter 'style' te funkcije. Ta parameter v osnovi obravnava morske teme. Trenutno jih je na voljo pet, in sicer temna mreža, klopi, bela mreža, bela in temna.

Razmislite o naslednjem primeru, ki prikazuje belo temo.

PRIMER:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', podatki = a)

IZHOD:

V zgornjem izhodu lahko opazite, da je tema spremenjena v belo. Nadalje jih lahko raziščete tudi z drugimi temami. Če opazite v prejšnjem izhodu, so okrog grafa prisotne osi. Vendar je to mogoče prilagoditi tudi s funkcijo despine (). Oglejte si spodnji primer.

PRIMER:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', podatki = a) sns.despine (odmik = 10, trim = True)

IZHOD:



Upoštevajte razliko med prejšnjima izhodoma. Vendar obstaja še veliko več možnosti, ki jih lahko raziščete sami.

Barvne palete Python Seaborn:

Barva je v bistvu značilnost, ki se približa človeškim očem poleg katere koli druge lastnosti. Seaborn vam omogoča igranje z barvami z različnimi funkcijami, kot so color_palette (), hls_palette (), husl_palette () itd. Oglejte si barve, ki so trenutno prisotne v seaborn.

PRIMER:

uvoz numpy kot np uvoz seaborn kot sns uvoz matplotlib.pyplot kot plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

IZHOD:

Zgornja slika prikazuje barve, ki so prisotne v morju. To sem naredil s pomočjo funkcije palplot (). Za globlje različice lahko uporabite hls_palette (), husl_palette () itd.

To nas pripelje do konca vadnice Python Seaborn. Upam, da ste vse jasno razumeli. Poskrbite, da boste čim več vadili .

Imate vprašanje za nas? Prosimo, omenite ga v oddelku za komentarje v tem blogu 'Vadnica za Python Seaborn', mi se vam bomo javili v najkrajšem možnem času.

Če želite pridobiti poglobljeno znanje o Pythonu skupaj z različnimi aplikacijami, se lahko prijavite v živo s 24-urno podporo in življenjskim dostopom.