Kaj je nevronska mreža? Uvod v umetne nevronske mreže



Ta spletni dnevnik o tem, kaj je nevronsko omrežje, vam bo predstavil osnovne koncepte nevronskih omrežij in kako lahko rešujejo zapletene težave, ki jih vodijo podatki.

Z napredkom strojnega učenja, je šel po visoki cesti. Poglobljeno učenje velja za najnaprednejšo tehnologijo, zasnovano za reševanje zapletenih problemov, ki uporabljajo velike nabore podatkov. Ta spletni dnevnik o tem, kaj je nevronsko omrežje, vam bo predstavil osnovne koncepte nevronskih omrežij in kako lahko rešujejo zapletene težave, ki jih vodijo podatki.

Če želite pridobiti poglobljeno znanje o umetni inteligenci in globokem učenju, se lahko vpišete v živo Edureka s 24-urno podporo in življenjskim dostopom.





Tu je seznam tem, ki bodo obravnavane v tem Spletni dnevnik:

  1. Kaj je nevronska mreža?
  2. Kaj je poglobljeno učenje?
  3. Razlika med AI, ML in, DL
  4. Potreba po globokem učenju
  5. Primer globokega učenja
  6. Kako delujejo nevronske mreže?
  7. Nevronska mreža, pojasnjena s primerom

Preprosta opredelitev nevronske mreže

Oblikovano v skladu s človeškimi možgani, a Nevronska mreža je bila zgrajena tako, da posnema funkcionalnost človeških možganov . Človeški možgani so nevronska mreža, sestavljena iz več nevronov, podobno je Umetna nevronska mreža (ANN) sestavljena iz več perceptronov (razloženo kasneje).



Nevronska mreža - Kaj je nevronska mreža - Edureka

Nevronska mreža je sestavljena iz treh pomembnih plasti:

  • Vhodni sloj: Kot že ime pove, ta plast sprejema vse vhode, ki jih nudi programer.
  • Skrita plast: Med vhodno in izhodno plastjo je nabor slojev, znanih kot skrite plasti. V tej plasti se izvajajo izračuni, ki imajo za posledico rezultat.
  • Izhodni sloj: Vhodi gredo skozi vrsto transformacij skozi skrito plast, ki končno privede do izhoda, ki je dostavljen prek tega plast.

Preden se spustimo v globino delovanja nevronske mreže, razberemo, kaj je poglobljeno učenje.



Kaj je poglobljeno učenje?

Poglobljeno učenje je napredno področje strojnega učenja, ki uporablja koncepte nevronskih mrež za reševanje zelo računskih primerov uporabe, ki vključujejo analizo večdimenzionalnih podatkov. Avtomatizira postopek pridobivanja lastnosti in poskrbi, da je potreben zelo minimalen človeški poseg.

Kaj pravzaprav je globoko učenje?

Deep Learning je napreden podpodročje strojnega učenja, ki uporablja algoritme, ki jih navdihuje struktura in delovanje možganov, imenovano Umetne nevronske mreže.

Razlika med AI, ML in DL (umetna inteligenca vs strojno učenje proti globokemu učenju)

Ljudje to pogosto mislijo , , in Globoko učenje so enake, saj imajo običajne aplikacije. Na primer, Siri je aplikacija umetne inteligence, strojnega učenja in globokega učenja.

pretvori objekt v array php

Torej, kako so te tehnologije povezane?

  • Umetna inteligenca je znanost pridobivanja strojev, ki posnemajo vedenje ljudi.
  • Strojno učenje je podmnožica umetne inteligence (AI), ki se osredotoča na pridobivanje strojev, da se odločajo tako, da jim posredujejo podatke.
  • Globoko učenje je podskupina strojnega učenja, ki uporablja koncept nevronskih mrež za reševanje zapletenih problemov.

Če povzamemo, AI, strojno učenje in poglobljeno učenje sta med seboj povezani področji. Strojno učenje in globoko učenje pomagata umetni inteligenci z zagotavljanjem nabora algoritmov in nevronskih mrež za reševanje podatkovne težave.

Zdaj, ko ste seznanjeni z osnovami, ugotovimo, kaj je privedlo do potrebe po globokem učenju.

Potreba po globokem učenju: Omejitve tradicionalnih algoritmov in tehnik strojnega učenja

Strojno učenje je pomenilo velik preboj v tehničnem svetu, pripeljalo je do avtomatizacije enoličnih in dolgotrajnih nalog, pomagalo je pri reševanju zapletenih problemov in pametnejšim odločitvam. Vendar pa je bilo pri strojnem učenju nekaj pomanjkljivosti, ki so privedle do pojava globokega učenja.

Tu je nekaj omejitev strojnega učenja:

  1. Visokorazsežnih podatkov ni mogoče obdelati: Strojno učenje lahko obdeluje le majhne dimenzije podatkov, ki vsebujejo majhen nabor spremenljivk. Če želite analizirati podatke, ki vsebujejo 100 s spremenljivkami, potem strojnega učenja ni mogoče uporabiti.
  2. Funkcijski inženiring je ročen: Razmislite o primeru uporabe, ko imate 100 napovedovalnih spremenljivk in morate zožiti samo pomembne. Če želite to narediti, morate ročno preučiti razmerje med vsako spremenljivko in ugotoviti, katere so pomembne pri napovedovanju rezultata. Ta naloga je za razvijalca izjemno dolgočasna in zamudna.
  3. Ni idealno za zaznavanje predmetov in obdelavo slik: Ker zaznavanje predmetov zahteva visokodimenzionalne podatke, strojnega učenja ni mogoče uporabiti za obdelavo naborov slikovnih podatkov, zato je idealen samo za nabore podatkov z omejenim številom funkcij.

Preden pridemo v globino Neural Networks, razmislimo o resničnem primeru uporabe, kjer se izvaja globoko učenje.

Primer / aplikacije za globoko učenje

Ali ste vedeli, da PayPal svojih več kot 170 milijonov strank obdela štiri milijone transakcij v višini 235 milijard USD? To ogromno količino podatkov med drugimi razlogi ugotavlja morebitne goljufive dejavnosti.

java koda za konec programa

PayPal je s pomočjo algoritmov za globoko učenje izkopal podatke iz zgodovine nakupov svojih strank, poleg tega pa je pregledal vzorce verjetnih goljufij, shranjenih v svojih zbirkah podatkov, da bi napovedal, ali je določena transakcija goljufiva ali ne.

Podjetje se že približno 10 let zanaša na tehnologijo globokega učenja in strojnega učenja. Sprva je skupina za nadzor goljufij uporabljala preproste, linearne modele. Toda z leti je podjetje prešlo na naprednejšo tehnologijo strojnega učenja, imenovano globoko učenje.

Upravitelj tveganja goljufij in znanstvenik za podatke pri PayPal, Ke Wang, citirano:

»Pri sodobnejšem in naprednejšem strojnem učenju uživamo v njegovi sposobnosti, da porabi veliko več podatkov, obdeluje plasti in plasti abstrakcije in lahko vidi stvari, ki jih preprostejša tehnologija ne bi mogla videti, tudi ljudje ne morem videti. '

Preprost linearni model lahko porabi približno 20 spremenljivk. S tehnologijo globokega učenja pa lahko zaženemo na tisoče podatkovnih točk. Zato z izvajanjem Tehnologija globokega učenja lahko PayPal končno analizira milijone transakcij, da ugotovi morebitne goljufije dejavnosti.

Zdaj pa pojdimo v globine nevronske mreže in razumemo, kako delujejo.

Kako deluje nevronska mreža?

Da bi razumeli nevronske mreže, ga moramo razčleniti in razumeti najosnovnejšo enoto nevronske mreže, to je Perceptron.

Kaj je perceptron?

Perceptron je enoslojna nevronska mreža, ki se uporablja za klasifikacijo linearnih podatkov. Ima 4 pomembne komponente:

  1. Vhodi
  2. Uteži in pristranskost
  3. Funkcija seštevanja
  4. Funkcija aktiviranja ali preoblikovanja

Osnovna logika Perceptrona je naslednja:

Vhodi (x), prejeti iz vhodne plasti, se pomnožijo z njihovimi dodeljenimi utežmi w. Pomnožene vrednosti se nato dodajo v Uteženo vsoto. Ponderirana vsota vhodov in njihove uteži se nato uporabijo za ustrezno funkcijo aktiviranja. Funkcija aktiviranja preslika vhod na ustrezen izhod.

Uteži in pristranskost pri globokem učenju

Zakaj moramo vsakemu vhodu dodeliti uteži?

Ko je vhodna spremenljivka dovedena v omrežje, se kot teža tega vhoda dodeli naključno izbrana vrednost. Utež vsake vhodne podatkovne točke kaže, kako pomemben je ta vhodni napoved pri izidu.

Parameter pristranskosti pa vam omogoča, da prilagodite krivuljo funkcije aktiviranja tako, da dosežete natančen izhod.

Funkcija seštevanja

Ko je vhodom dodeljena določena teža, se vzame zmnožek ustreznega vhoda in teže. Z dodajanjem vseh teh izdelkov dobimo tehtano vsoto. To naredi funkcija seštevanja.

Funkcija aktiviranja

Glavni cilj aktivacijskih funkcij je preslikati tehtano vsoto na izhod. Aktivacijske funkcije, kot so tanh, ReLU, sigmoid itd., So primeri transformacijskih funkcij.

Če želite izvedeti več o funkcijah perceptronov, lahko to preberete Spletni dnevnik.

Preden smo zaključimo ta blog, vzemimo preprost primer, da bomo razumeli, kako deluje nevronska mreža.

Nevronske mreže, pojasnjene s primerom

Razmislite o scenariju, v katerem želite zgraditi umetno nevronsko mrežo (ANN), ki slike razvrsti v dva razreda:

nastavitev poti razreda v javi
  • Razred A: Vsebuje slike nebolelih listov
  • Razred B: Vsebovanje slik obolelih listov

Torej, kako ustvariti nevronsko mrežo, ki liste razvršča v obolele in nebolele posevke?

Postopek se vedno začne z obdelavo in preoblikovanjem vložka tako, da ga je mogoče enostavno obdelati. V našem primeru bo vsaka listna slika razčlenjena na slikovne pike, odvisno od dimenzije slike.

Če je slika na primer sestavljena iz 30 krat 30 slikovnih pik, bo skupno število slikovnih pik 900. Te slikovne pike so predstavljene kot matrike, ki se nato vnesejo v vhodno plast nevronske mreže.

Tako kot imajo naši možgani nevrone, ki pomagajo pri gradnji in povezovanju misli, ima tudi ANN perceptrone, ki sprejemajo vhode in jih obdelujejo tako, da jih prenašajo iz vhodne plasti v skrito in končno izhodno plast.

Ko se vhod prenaša iz vhodne plasti v skrito plast, se vsakemu vhodu dodeli začetna naključna teža. Nato se vhodi pomnožijo z ustreznimi utežmi in njihova vsota se pošlje kot vhod v naslednji skriti sloj.

Tu je vsakemu perceptronu dodeljena številčna vrednost, imenovana pristranskost, ki je povezana z utežjo vsakega vhoda. Nadalje se vsak perceptron prenese skozi aktivacijo ali funkcijo transformacije, ki določa, ali se določen perceptron aktivira ali ne.

Aktivirani perceptron se uporablja za prenos podatkov v naslednjo plast. Na ta način se podatki širijo (širjenje naprej) skozi nevronsko mrežo, dokler perceptroni ne dosežejo izhodne plasti.

Na izhodni plasti se izvede verjetnost, ki odloča, ali podatki spadajo v razred A ali razred B.

Sliši se preprosto, kajne? No, koncept nevronskih mrež temelji izključno na delovanju človeških možganov. Potrebujete poglobljeno znanje različnih matematičnih konceptov in algoritmov. Tukaj je seznam blogov za začetek:

  1. Kaj je poglobljeno učenje? Začetek globokega učenja
  2. Globoko učenje s Pythonom: Vodnik za globinsko učenje za začetnike

Če se vam zdi ta spletni dnevnik ustrezen, si oglejte Edureka, zaupanja vredno podjetje za spletno učenje z mrežo več kot 250.000 zadovoljnih učencev, ki se širijo po vsem svetu. Tečaj Edureka za poglobljeno učenje s certifikatom TensorFlow pomaga učencem, da postanejo strokovnjaki pri usposabljanju in optimizaciji osnovnih in konvolucijskih nevronskih mrež z uporabo projektov in nalog v realnem času, skupaj s koncepti, kot so funkcija SoftMax, samodejno kodiranje nevronskih omrežij, omejeni stroj Boltzmann (RBM).