Fuzzy K-Meas Grudenje v Mahoutu



Ta blog predstavlja uvod v združevanje Fuzzy K-Means v Apache Mahout.

Fuzzy K-Means je popolnoma enak algoritem kot K-pomeni, kar je priljubljena preprosta tehnika združevanja v skupine. Edina razlika je v tem, da lahko namesto točke dodeli izključno samo enemu grozdu, nekakšno nejasnost ali prekrivanje med dvema ali več grozdi. Sledijo ključne točke, ki opisujejo Fuzzy K-Means:





  • Za razliko od K-Means, ki išče trde gruče, pri čemer vsaka od točk pripada eni gruči, Fuzzy K-Means išče mehkejše gruče za prekrivanje.
  • Ena točka v mehki gruči lahko pripada več kot enim gručam z določeno vrednostjo afinitete do vsake od točk.
  • Afiniteta je sorazmerna z oddaljenostjo te točke od težišča grozda.
  • Podobno kot K-Means tudi Fuzzy K-Means deluje na predmete, ki imajo določeno mero razdalje in jih je mogoče predstaviti v n- dimenzijski vektorski prostor.

Zemljevid mehkih K-središč Zmanjšajte pretok

Med MapReduce pretokom K-Means in Fuzzy K-Means ni velike razlike. Izvedba obeh v Mahoutu je podobna.

c ++ razvrsti int matriko

Sledijo bistveni parametri za izvajanje Fuzzy K-Means:



  • Za vnos potrebujete nabor podatkov Vector.
  • Za sejanje začetnih k grozdov mora obstajati RandomSeedGenerator.
  • Za merjenje razdalje je potreben SquaredEuclideanDistanceMeasure.
  • Velika vrednost konvergenčnega praga, na primer –cd 1,0, če je bila uporabljena kvadratna vrednost mere razdalje
  • Vrednost za maxIterations je privzeta vrednost -x 10.
  • Koeficient normalizacije ali faktor nejasnosti z vrednostjo večjo od -m 1,0

Imate vprašanje za nas? Omenite jih v oddelku za komentarje in javili se vam bomo.

kaj je tiskalnik v javi

Sorodne objave



Nadzorovano učenje v Apache Mahout