Zakaj bi se mešali, ko se že lahko pridružite tabeli?



Mešanje podatkov v tabeli - metoda, ki se uporablja, kadar so v več virih podatkov povezani podatki, ki jih želite analizirati skupaj v enem pogledu.

V svetu, ki dnevno ustvari in porabi 2,5 kvintiljona bajtov podatkov, bodo organizacije dolžne iskati nove metode za preoblikovanje in združevanje podatkov, da bi dosegle optimalno učinkovitost. Eden takih načinov kombiniranja podatkov je Mešanje podatkov v tabeli .

Ker ima to zdaj tako pomemben namen v podatkovnem ciklusu katere koli organizacije, je v večini zelo pomemben modul . V tem blogu bomo obravnavali naslednje koncepte:





Zakaj potrebujete mešanje podatkov v tabeli?

Recimo, da ste a Razvijalna tabela ki ima podatke o transakcijah shranjene v Salesforceu in podatke o kvotah, shranjene v Accessu. Podatki, ki jih želite združiti, so shranjeni v različnih zbirkah podatkov, razdrobljenost podatkov, zajetih v vsaki tabeli, pa je v obeh virih podatkov različna, zato je mešanje podatkov najboljši način za združitev teh podatkov.

vrste filtrov v tabeli

Mešanje podatkov je koristno v naslednjih pogojih:



  1. Želite združiti podatke iz različnih zbirk podatkov, ki jih združitve med bazami podatkov ne podpirajo.

    Združevanja med bazami podatkov ne podpirajo povezav s kockami (na primer Oracle Essbase) ali z nekaterimi povezavami samo z izvlečki (na primer Google Analytics). V tem primeru nastavite posamezne vire podatkov za podatke, ki jih želite analizirati, in nato z mešanjem podatkov združite vire podatkov na enem listu.

  2. Podatki so na različnih ravneh podrobnosti.

    Včasih en nabor podatkov zajema podatke z različnimi ravni podrobnosti tj. večja ali manjša razdrobljenost kot drugi nabor podatkov.

    Denimo, da analizirate podatke o transakcijah in podatke o kvotah. Transakcijski podatki lahko zajemajo vse transakcije. Podatki o kvotah pa lahko seštevajo transakcije na četrtletni ravni. Ker so transakcijske vrednosti zajete na različnih ravneh podrobnosti v vsakem naboru podatkov, bi morali za kombiniranje podatkov uporabiti mešanje podatkov.



Kaj je mešanje podatkov v tabeli?

Združevanje podatkov je zelo zmogljiva funkcija v Odbor . Uporablja se, če so v več virih podatkov povezani podatki, ki jih želite analizirati skupaj v enem pogledu. Je metoda za kombiniranje podatkov, ki dopolnjuje tabelo podatkov iz enega vira podatkov s stolpci podatkov iz drugega vira podatkov.

Običajno za združevanje podatkov uporabljate združevanja, vendar je včasih bolje uporabiti mešanje podatkov, odvisno od dejavnikov, kot so vrsta podatkov in njihova razdrobljenost.

V čem se razlikuje od združevanja podatkov?

Mešanje podatkov simulira tradicionalno levo združevanje. Glavna razlika med obema je kdaj združevanje se izvede glede na združevanje.

Levo pridruži

Ko za združevanje podatkov uporabite levo združitev, se poizvedba pošlje v bazo podatkov, kjer se združevanje izvede. Uporaba levega združevanja vrne vse vrstice iz leve tabele in vse vrstice iz desne tabele, ki ima v levi tabeli ustrezno ujemanje vrstic. Rezultati združevanja se nato pošljejo nazaj in zberejo Tableau.

Denimo, da imate naslednje tabele. Če so skupni stolpci Uporabniško ime , levo združevanje vzame vse podatke iz leve tabele, kot tudi vse podatke iz desne tabele, ker ima vsaka vrstica v levi tabeli ustrezno ujemanje.

Združevanje podatkov - mešanje podatkov v tabeli - EdurekaMešanje podatkov

Ko za združevanje podatkov uporabljate mešanje podatkov, se v bazo podatkov pošlje poizvedba za vsak vir podatkov, ki se uporablja na listu. Rezultati poizvedb, vključno z zbirnimi podatki, se vrnejo in združijo v Tableau. Pogled uporablja vse vrstice iz primarnega vira podatkov, leve tabele in združene vrstice iz sekundarnega vira podatkov, desne tabele, glede na dimenzijo povezovalnih polj.

Polje povezovanja lahko spremenite ali dodate več polj povezovanja, da v mešanico vključite različne ali dodatne vrstice podatkov iz sekundarnega vira podatkov, pri čemer spremenite združene vrednosti.

Denimo, da imate naslednje tabele. Če so povezovalna polja Uporabniško ime v obeh tabelah mešanje vaših podatkov zajema vse podatke iz leve tabele, levo tabelo pa dopolnjuje s podatki iz desne tabele. V tem primeru niso vse vrednosti lahko del dobljene tabele zaradi naslednjega:

  • Vrstica v levi tabeli nima ustreznega ujemanja vrstice v desni tabeli, kot kaže ničelna vrednost.
  • V vrsticah v desni tabeli je več ustreznih vrednosti, kot je označeno z zvezdico (*).

Recimo, da imate enake tabele kot zgoraj, vendar sekundarni vir podatkov vsebuje novo polje, imenovano Namen . Še enkrat, če je povezovalno polje Uporabniško ime , mešanje vaših podatkov vzame vse podatke iz leve tabele in jih dopolni s podatki iz desne tabele. V tem primeru poleg prejšnjega primera vidite enako ničelno vrednost in zvezdice v prejšnjem primeru:

  • Zaradi Namen polje je merilo, vidite vrednosti vrstic zaNamenpolje, ki je združeno, preden se podatki v desni tabeli kombinirajo s podatki v levi tabeli.
  • Tako kot v prejšnjem primeru vrstica v levi tabeli nima ustrezne vrstice za Namen polje, kot kaže druga ničelna vrednost.

Kdaj nadomestiti članstvo Mešanje

1. Podatke je treba očistiti.

Če se vaše tabele po združitvi ne ujemajo pravilno, nastavite vire podatkov za vsako tabelo, izvedite potrebne prilagoditve (to je preimenovanje stolpcev, spreminjanje podatkovnih vrst stolpcev, ustvarjanje skupin, uporaba izračunov itd.) In nato za kombiniranje podatkov uporabite mešanje podatkov.

2. Pridružitve povzročajo podvojene podatke.

Podvojeni podatki po združitvi so simptomi podatkov na različnih ravneh podrobnosti. Če opazite podvojene podatke, namesto da ustvarite združitev, uporabite mešanje podatkov, da namesto tega združite skupno skupnost.

3. Na voljo imate veliko podatkov.

Običajno so združevanja priporočljiva za kombiniranje podatkov iz iste baze podatkov. Združevanja ureja baza podatkov, kar združevanjem omogoča izkoriščanje nekaterih izvornih zmožnosti baze podatkov. Če pa delate z velikimi nabori podatkov, lahko združevanje obremeni bazo podatkov in znatno vpliva na zmogljivost. V tem primeru bi lahko pomagalo mešanje podatkov. Ker tabela obravnava kombiniranje podatkov po združevanju podatkov, je manj podatkov za kombiniranje. Če je manj podatkov za kombiniranje, se na splošno izboljša zmogljivost.

Združevanje vaših podatkov v tabeli

Mešanje podatkov lahko uporabite, če imate podatke v ločenih virih podatkov, ki jih želite skupaj analizirati na enem listu. Tableau ima dva vgrajena vira podatkov Vzorec-superstore in Vzorčna veriga kave.mdb ki bo uporabljen za ponazoritev mešanja podatkov.

1. korak: povežite se s svojimi podatki in nastavite vire podatkov

  • Povežite se z nizom podatkov in nastavite vir podatkov na strani z viri podatkov. Ivgrajen vir podatkov Vzorčna veriga kave.mdb ,ki je datoteka zbirke podatkov MS Access, bo uporabljena za ponazoritev mešanja podatkov.
  • Pojdi do Podatki > Nov vir podatkov, se povežite z drugim nizom podatkov.Ta primer uporablja Vzorec - Superstore vir podatkov. Tkonec nastavitve vira podatkov.
  • Kliknite jeziček lista, da začnete graditi svoj pogled.

2. korak: Določite primarni vir podatkov

  • Povlecite vsaj eno polje iz primarnega vira podatkov v pogled, da ga označite kot primarni vir podatkov. V Podatki v podoknu kliknite vir podatkov, ki ga želite določiti kot primarni vir podatkov. V tem primeru Vzorčna veriga kave je izbrano.
  • Naslednja slika zaslona prikazuje različne tabele in združitve, ki so na voljo v datoteki.

3. korak: Določite sekundarni vir podatkov

  • Polja, uporabljena v pogledu iz podatkovnih virov, ki niso primarni vir podatkov ali aktivne povezave, samodejno določijo nadaljnje vire podatkov kot sekundarni vir podatkov. V tem primeru Sample Superstore.

4. korak: združi podatke

  • Zdaj lahko podatke iz obeh virov integrirate na podlagi skupne dimenzije ( Država , v tem primeru). Upoštevajte, da se ob dimenziji - Stanje prikaže slika majhne povezave. To kaže na skupno razsežnost obeh virov podatkov.
  • Denimo, da ustvarite palični grafikon z Razmerje med dobičkom v polici stolpcev in Država v vrstici z vrsticami grafikon prikazuje, kako se razmerje dobička razlikuje za vsako državo tako v supermarketi kot v kavarni.

Omejitve mešanja podatkov v tabeli

  1. Obstaja nekaj omejitev mešanja podatkov okoli neaditivnih agregatov, kot je MEDIJAN , in RAWSQLAGG .
  2. Mešanje podatkov ogroža hitrost poizvedbe z visoko granulacijo.
  3. Ko poskušate razvrstiti po izračunanem polju, ki uporablja mešane podatke, izračunano polje ni navedeno na spustnem seznamu Polje v pogovornem oknu Razvrsti.
  4. Viri podatkov Cube se lahko uporabljajo samo kot primarni vir podatkov za mešanje podatkov v tabeli. Ne morejo se uporabljati kot sekundarni viri podatkov.

Upam, da imate zdaj vsi pošteno predstavo o tem Mešanje podatkov v tabeli iz tega bloga. Lačni več znanja? Ne skrbite, ta video vam bo omogočil boljše razumevanje koncepta.