Arhitektura podatkovnega skladišča



Ta spletni dnevnik izpostavlja celotno arhitekturo podatkovnega skladišča

Kaj je skladišče podatkov?

Skladišče podatkov je osrednja lokacija, kjer se shranjujejo združeni podatki z več lokacij. Skladišče podatkov se ne naloži vsakič, ko se ustvarijo novi podatki, vendar ga lahko končni uporabnik oceni, kadar potrebuje nekaj informacij. Podjetje določa določene časovne roke, kdaj je treba naložiti skladišče podatkov, in sicer vsak dan, mesečno ali enkrat v četrtletju.





Arhitektura podatkovnega skladišča

Različni sistemi za shranjevanje podatkov imajo različne strukture. Nekateri imajo lahko majhno število virov podatkov, drugi pa lahko velike.

Kot je omenjeno na sliki, obstaja več transakcijskih sistemov, vir 1 in drugi viri. Vir je lahko SAP ali ploščate datoteke, zato je lahko kombinacija virov. ETL (Extract, Transfer, Load) se uporablja za nalaganje skladišča podatkov v podatkovne polja. Razlika med podatkovno hišo in podatkovno zbirko je v tem, da se podatkovno skladišče uporablja v vseh organizacijah, medtem ko se podatkovne oznake uporabljajo za individualno poročanje po meri.



V podjetju je na primer več oddelkov, kot je finančni, ki se zelo razlikuje od oddelka za trženje. Vsi črpajo podatke iz različnih virov in potrebujejo prilagojeno poročanje. Oddelek za finance se ukvarja predvsem s statistiko, oddelek za trženje pa s promocijami. Oddelek za trženje ne zahteva nobenih informacij o financah.

Za prilagojeno poročanje so potrebne podmnožice podatkovnega skladišča, imenovane podatkovni koti. Obstajata dva pristopa za nalaganje. Najprej naložite podatkovno skladišče in nato naložite strežnike ali obratno. V scenariju poročanja, ki je plast dostopa do podatkov, uporabnik dostopa do podatkovnega skladišča in generira poročilo. Vsa ta orodja za poročanje naj bi potrošniku izjemno olajšala vmesnik, saj ljudi na ravni odločanja ne zanimajo tehnične informacije. Skrbijo predvsem za uporabno poročilo.

Zato vsa ta orodja za poročanje delujejo na sprednji strani, na zadnji strani pa generirajo poizvedbe in zadevajo bazo podatkov, uporabnik pa poročilo dobi pravočasno. Ta orodja za poročanje lahko razporejajo izvajanje zalog in generiranje poročil.



Imate vprašanje za nas? Prosimo, da jih omenite v oddelku za komentarje, pa se vam bomo oglasili.

Sorodne objave:

python kaj je __init__