NameNode High Availability with Quorum Journal Manager



NameNode High Availability je ena najpomembnejših lastnosti Hadoop 2.0 NameNode High Availability z Quorum Journal Manager se uporablja za skupno rabo dnevnikov urejanja med aktivnimi in pripravljenimi NameNodes.

To je ena najpomembnejših lastnosti Hadoop 2.0. Pred razpravo o funkciji Namenode High Availability je nujno vedeti, kaj je Quorum. Sklepčnost je splošni izraz, ki se uporablja pri združevanju v skupine, kjer rečemo, da je določena skupina stabilna. Zbor vsebuje seznam strojev in pomaga določiti zdravje grozda. Obstajata dve vrsti sklepčnosti: pričakovani in izračunani sklepčnost.





NameNode High Availability with Quorum Journal Manager (QJM)

Pred Hadoop 2.0 je bilo NameNode ena točka okvare (SPOF) v gruči HDFS. Vsaka gruča je imela eno NameNode in če ta računalnik ni bil na voljo, gruča v celoti ne bi bila na voljo, dokler NameNode ne bi bilo znova zagnano ali zagnano na ločenem računalniku. V klasični gruči HA sta dva ločena stroja konfigurirana kot NameNodes. Kadar koli bo eno od vozlišč Name v aktivnem stanju, drugo pa v stanju pripravljenosti. Active NameNode je odgovoren za vse odjemalske operacije v gruči, medtem ko je stanje pripravljenosti preprosto podrejeno in vzdržuje dovolj stanja, da omogoči hitro preusmeritev.

Da bi vozlišče v stanju pripravljenosti ohranilo svoje stanje usklajeno z vozliščem Active, obe vozli komunicirata s skupino ločenih demonov, imenovano „JournalNodes“ (JN). Ko vozlišče Active izvede katero koli spremembo imenskega prostora, zabeleži zapis opravljenih sprememb v JournalNodes. Vozlišče v stanju pripravljenosti lahko bere spremenjene informacije iz JN-jev in jih redno spremlja glede sprememb. Ko vozlišče v pripravljenosti vidi spremembe, jih nato uporabi v svojem imenskem prostoru. V primeru odpovedi bo pripravljenost zagotovila, da je prebrala vse spremembe iz JounalNodes, preden je svoje stanje spremenila v 'Active state'. To zagotavlja, da se stanje imenskega prostora v celoti sinhronizira, preden pride do preklopa.



vrste transformacij v informatiki

Za hitro odpoved je nujno, da mora vozlišče v stanju pripravljenosti imeti posodobljene in trenutne informacije o lokaciji blokov v gruči. Da bi se to zgodilo, so DataNodes konfigurirani z lokacijo obeh NameNodes in obema pošiljajo informacije o lokaciji bloka in srčne utripe.

Bistveno je, da mora biti naenkrat aktivno le eno od vozlišč imen. V nasprotnem primeru bi stanje imenskega prostora odstopalo med njima in povzročilo izgubo podatkov ali napačne rezultate. Da bi se temu izognili, bodo JournalNodes naenkrat dovolili samo eno NameNode za zapisovalnik. Med failoverjem bo NameNode, ki bo postal aktiven, prevzel odgovornost za pisanje v JournalNodes.

Imate vprašanje za nas? Prosimo, da jih omenite v oddelku za komentarje, pa se vam bomo oglasili.



Sorodne objave:

Pregled združenja arhitekture grozdov Hadoop 2.0