Namestitev Apache Pig v Linux



Ta spletni dnevnik je vodnik po korakih za namestitev Apache Pig v okolju Linux. Namestili bomo Apache Pig 0.16.0 in ga zagnali v različnih načinih.

V tej objavi bom govoril o Namestitev Apache Pig v Linux . Začnimo z osnovno definicijo Apache Pig in Pig Latin.

Apache Pig je orodje / platforma za ustvarjanje in izvajanje programa Map Reduce, ki se uporablja s Hadoop. Je orodje / platforma za analizo velikih naborov podatkov. Lahko rečete, Apache Pig je abstrakcija nad MapReduce. Programerji, ki v Javi niso tako dobri, so se včasih trudili delati na Hadoopu, predvsem med pisanjem zaposlitev MapReduce.Torej, to je pomembna tema za učenje in obvladovanje .Apache Pig ima svoj jezik Prašičja latinščina kar je dobro za slabe programerje.





Osnovni uvod v prašičje latinščino vam bo pomagal bolje razumeti:

Imenuje se proceduralni jezik na visoki ravni, ki se uporablja v platformi Apache Pig Prašičja latinščina . Apache Pig vsebuje 'Pig Latin', ki je sorazmerno preprostejši jezik in lahko prenaša distribuirane nabore podatkov v datotečnem sistemu Hadoop (HDFS). V Apache Pig morate napisati Pig skripte z uporabo jezika Pig Latin, ki se pretvori v MapReduce, ko zaženete Pig script. Apache Pig ima različne operaterje, ki se uporabljajo za izvajanje nalog, kot so branje, pisanje in obdelava podatkov. Če želite izvedeti več o operaterjih Apache Pig, obiščite naš spletni dnevnik “ Operaterji v Apache Pig: 1. del - Relacijski operaterji '.

Zdaj, ko dobro poznate Apache Pig, začnimo z namestitvijo Apache Pig v Linuxu.



Namestitev Apache Pig v Linux:

Spodaj so navedeni koraki za namestitev Apache Pig v Linux (ubuntu / centos / windows z uporabo Linux VM). V spodnji nastavitvi uporabljam Ubuntu 16.04.

Korak 1: Prenesi Prašič katran mapa.

Ukaz: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Naložite Pig - Pig Installation - Edureka

razlika med hash tabelo in hash map

2. korak: Izvlecite katran datoteko z ukazom tar. V spodnjem ukazu tar, x pomeni izvleči arhivsko datoteko, s pomeni filtriranje arhiva skozi gzip, f pomeni ime datoteke arhivske datoteke.

Ukaz: katran -xzf prašič-0,16.0.tar.gz

Ukaz: ls

3. korak: Uredite .bashrc ”Za posodobitev spremenljivk okolja Apache Pig. Nastavljamo ga tako, da imamo dostop do prašiča iz katerega koli imenika, za izvajanje ukazov prašiča ni treba iti v imenik prašičev. Če katera koli druga aplikacija išče Pig, bo iz te datoteke spoznala pot Apache Pig.

Ukaz: sudo gedit .bashrc

Na koncu datoteke dodajte naslednje:

# Nastavite PIG_HOME

izvoz PIG_HOME = / home / edureka / pig-0.16.0
izvoz POT = $ PATH: /home/edureka/pig-0.16.0/bin
izvoz PIG_CLASSPATH = $ HADOOP_CONF_DIR

Prepričajte se tudi, da je nastavljena tudi hadoop pot.

Zaženite spodnji ukaz, da se spremembe posodobijo v istem terminalu.

Ukaz: vir .bashrc

4. korak: Preverite različico prašiča. S tem želimo preveriti, ali je Apache Pig pravilno nameščen. Če ne dobite različice Apache Pig, morate preveriti, ali ste zgornje korake pravilno upoštevali.

Ukaz: prašičja -verzija

5. korak :Preverite pomoč za prašiča, da vidite vse možnosti ukaza za prašiče.

Ukaz: prašič-pomoč

kako uporabiti sort c ++

6. korak :Zaženite Pig, da zaženete grunt lupino. Grunt lupina se uporablja za zagon skriptov Pig Latin.

Ukaz: prašič

Če pravilno pogledate zgornjo sliko, ima Apache Pig dva načina, v katerih lahko deluje, privzeto izbere način MapReduce. Drugi način, v katerem lahko zaženete Pig, je lokalni način. Naj vam povem več o tem.

Načini izvajanja v Apache Pig:

  • MapReduce Mode - To je privzeti način, ki zahteva dostop do gruče Hadoop in namestitve HDFS. Ker je to privzeti način, ni treba določiti zastavice -x (lahko izvedete prašič ALI prašič -x mapreduce ). Vhod in izhod v tem načinu sta prisotna na HDFS.
  • Lokalni način - Z dostopom do ene naprave se vse datoteke namestijo in zaženejo z uporabo lokalnega gostitelja in datotečnega sistema. Tu je lokalni način določen z uporabo zastavice -x ( prašič -x lokalni ). Vhod in izhod v tem načinu sta prisotna v lokalnem datotečnem sistemu.

Ukaz: prašič -x lokalni

Spodaj si lahko ogledate video za ogled namestitve Apache Pig v Linuxu:

Namestitev Apache Pig | Namestitev prašičev v Linux | Edureka

Ko ste končali z namestitvijo Apache Pig v Linuxu, je naslednji korak naprej preizkusiti nekatere relacijske Pig operaterje v lupini Pig Grunt. Zato bo naslednji blog ' Operaterji v Apache Pig: 1. del - Relacijski operaterji ”Vam bo pomagal obvladati prašičereje.

Zdaj, ko ste v Linux namestili Apache Pig, si oglejte Edureka, zaupanja vredno podjetje za spletno učenje z mrežo več kot 250.000 zadovoljnih učencev, ki se širijo po vsem svetu. Tečaj Edureka Big Data Hadoop Certification Training pomaga učencem, da postanejo strokovnjaki za HDFS, prejo, MapReduce, Pig, Hive, HBase, Oozie, Flume in Sqoop z uporabo primerov uporabe v realnem času na področju maloprodaje, družbenih medijev, letalstva, turizma in financ.

Imate vprašanje za nas? Prosimo, omenite to v oddelku za komentarje in se vam bomo javili.