Kako zagnati skripte za panj?



To je vadnica o zagonu Hive Scripts. Zagon tega skripta bo zmanjšal čas in napor, ki smo si ga prizadevali za ročno pisanje in izvajanje vsakega ukaza.

Kot paket za skladiščenje podatkov, zgrajen na vrhu Hadoopa, se Apache Hive vse bolj uporablja za analizo podatkov, podatkovno rudarjenje in napovedno modeliranje. Organizacije iščejo strokovnjake, ki trdno držijo . V tej objavi si oglejmo, kako zagnati Hive Scripts. Na splošno uporabljamo skripte za izvajanje nabora stavkov hkrati. Panjevske skripte se uporabljajo precej na enak način. To bo zmanjšalo čas in trud, ki smo si ga prizadevali za ročno pisanje in izvajanje vsakega ukaza.

Hive Scripts so podprti v Hive 0.10.0 in novejših različicah. Ker je različica Hive 0.90 nameščena v CDH3, skriptov Hive v CDH3 ne moremo zagnati. V CDH4 lahko poskusite spodnje korake, saj je v njih nameščena različica Hive 0.10.0. Ali veste, kako ustvariti skrivnost za panj? Če ne, kliknite da bi dobili več pojasnil.





Master-Hive-Now

Zdaj pa poglejmo, kako napisati skripte v Hive in jih zagnati v CDH4:



1. korak: Pisanje skripta za panj.

Za pisanje skripta panja je treba datoteko shraniti s pripono .sql. Odprite terminal v distribuciji Cloudera CDH4 in podajte naslednji ukaz, da ustvarite Hive Script.
Ukaz: sudo gedit sample.sql

Po izvedbi zgornjega ukaza odpre datoteko s seznamom vseh ukazov panj, ki jih je treba izvesti.



V tem skriptu bo ustvarjena, opisana tabela, podatki bodo naloženi in pridobljeni iz tabele.

1. Ustvarjanje tabele v panju:

Ukaz: ustvari tabelo izdelek (productid: int, ime izdelka: niz, cena: plovec, kategorija: niz) vrstice oblikujejo ločena polja, ki se končajo z ‘,’

Tu je izdelek ime tabele, {productid, ime izdelka, cena, kategorija} pa stolpci te tabele.

Polja, ki se končajo z „,“ pomenijo, da so stolpci v vhodni datoteki ločeni s simbolom „,“.

Zapisi v vhodni datoteki so privzeto ločeni z novo vrstico.

2. Opis tabele:

Ukaz: opiši izdelek

Primer imenskega prostora c ++

3. Nalaganje podatkov v tabelo.

Če želite podatke najprej naložiti v tabelo, moramo ustvariti vhodno datoteko, ki vsebuje zapise, ki jih je treba vstaviti v tabelo.

Ustvarimo vhodno datoteko.

Ukaz: sudo gedit input.txt

Vsebino datoteke uredite, kot je prikazano na sliki.

4. Pridobivanje podatkov:

Za pridobitev podatkov se uporablja ukaz select.

Ukaz: Izberite * med izdelkom

Zgornji ukaz se uporablja za pridobivanje vrednosti vseh stolpcev v tabeli. Skript mora biti tak, kot je prikazan na spodnji sliki.

Zdaj smo končali s pisanjem skripta za panj. Datoteko sample.sql lahko zdaj shranite.

2. korak: Zagon skripta za panj

Sledi ukaz za zagon skripta Hive:

Ukaz: panj –f /dome/cloudera/sample.sql

Med izvajanjem skripta se prepričajte, da je prisotna celotna pot lokacije datoteke skripta.

Vidimo lahko, da se vsi ukazi uspešno izvajajo.

Tako se izvajajo in izvajajo skripti Hive v CDH4.

kako uporabljati pooblastila v javi -

Panj je ključna sestavina Hadoopa in vaše znanje v Hiveu vam lahko prinese najbolje plačana delovna mesta Hadoop! Edureka ima posebej urejen tečaj Hadoop, ki vam pomaga obvladati koncepte, kot so MapReduce, preja, prašiči, panj, HBase, Oozie, Flume in Sqoop. Za začetek kliknite spodnji gumb.

Imate vprašanje za nas? Prosimo, da jih omenite v oddelku za komentarje, pa se vam bomo oglasili.

Sorodne objave:

Ukazi za panj

Hive Data Modeli