Veliki Podatki

Odgovornosti skrbnika Hadoop

Ta spletni dnevnik o odgovornostih skrbnika Hadoop razpravlja o obsegu administracije Hadoop. Hadoop skrbniška delovna mesta so zelo zahtevna, zato se naučite Hadoopa zdaj!

Koraki za ustvarjanje UDF v Apache Pig

Apache Pig ima več vnaprej določenih funkcij. Objava vsebuje jasne korake za ustvarjanje UDF v Apache Pig. Tu so kode napisane v Javi in ​​zahtevajo Pig Library

Uvod v Apache Hive

Apache Hive je paket za skladiščenje podatkov, zgrajen na vrhu Hadoop-a in se uporablja za analizo podatkov. Panj je namenjen uporabnikom, ki so zadovoljni s sistemom SQL.

NameNode High Availability with Quorum Journal Manager

NameNode High Availability je ena najpomembnejših lastnosti Hadoop 2.0 NameNode High Availability z Quorum Journal Manager se uporablja za skupno rabo dnevnikov urejanja med aktivnimi in pripravljenimi NameNodes.

Hive Data Modeli

Podatkovni modeli Hive vsebujejo naslednje komponente, kot so zbirke podatkov, tabele, particije in segmenti ali grozdi.

4 Praktični razlogi za učenje Hadoop 2.0

Ti 4 razlogi za nadgradnjo na Hadoop 2.0 govorijo o trgu delovnih mest Hadoop in o tem, kako vam lahko pomaga pospešiti kariero, tako da se odprete za ogromne zaposlitvene priložnosti.

Primeri panja in preje na Spark

V tem blogu bomo na Sparku vodili primere panja in preje. Najprej zgradite panj in prejo na Spark, nato pa lahko primere panja in preje zaženete na Spark.

Globok potop v prašiča

Ta objava v spletnem dnevniku se poglobi v Prašiča in njegove funkcije. Našli boste predstavitev, kako lahko uporabljate Hadoop z uporabo Pig, ne da bi bili odvisni od Jave.

Ali za učenje Hadoopa potrebujete Javo?

Ta blog razpravlja o predpogojih za učenje Hadoop-a, bistve Java za Hadoop in odgovori 'ali za učenje Hadoop-a potrebujete Javo', če poznate Pig, Hive, HDFS.