Pagrindinis Naujovinti „Google“ dirbtinio intelekto „Alpha Go Zero“ tiesiog paspaudus „Reset“, kaip išmokti

„Google“ dirbtinio intelekto „Alpha Go Zero“ tiesiog paspaudus „Reset“, kaip išmokti

Jūsų Horoskopas Rytojui

Pamenate (neaiškiai), kaip išmokote vaikščioti, kalbėtis, važiuoti dviračiu ar vairuoti? Tai buvo netvarkinga ir pilna klaidų, tačiau įgūdžiai, kuriuos taip išmokai, išliko. Už gyvenamųjų sistemų ribų buvo sudėtinga sukurti pakankamai stiprius algoritmus, kad būtų galima įgyti „tikrojo gyvenimo patirtį“ ir sukurti lipnų, prisitaikantį elgesį dirbtiniam intelektui.

Na, „Alpha Go Zero“ tai tiesiog padarė.

„Tai prasideda nuo tuščio lapo ir išsiaiškina tik sau, tik iš savęs žaidimo ir be jokios žmogaus žinios, jokių žmogaus duomenų, bruožų, pavyzdžių ar žmonių įsikišimo. Iš pirmųjų principų sužinoma, kaip žaisti „Go“ žaidimą “, - sako„ DeepMind “profesorius Davidas Silveras.

Dirbtinis intelektas turėjo keletą pakartojimų, kiekvienas iš jų buvo protingesnis ir pajėgesnis nei anksčiau. Ankstesnėje versijoje buvo naudojama didžiulė ankstesnių žaidimų duomenų bazė kartu su daugybe algoritmų, kurie nukreipė jį į pergalę. Toks požiūris privertė nugalėti valdantį pasaulio čempioną profesionalų „Go“ žaidėją. Pokeryje „AI Libratus“ neseniai nulupo geriausius pasaulio pokerio žaidėjus beveik 2 milijonais dolerių, taip pat mokydamasis savarankiškai, o ne žmogaus žaidimo duomenimis.

Dawn Davenport ir Johanas Kokas

Dabar šioje naujausioje „Alpha Go“ versijoje mokyta dirbtinio intelekto programos pats kaip žaisti „Go“ - be žmogaus fono.

Vykdant milijonus žaidimų modeliavimo prieš save, prireikė 40 dienų, kol jis išmoko - nuo nulio - kaip įveikti patį pasaulio čempiono variantą. Tai tikrai keičia žaidimą ne tik „Go“, bet ir tai, kaip atrandamos naujos žinios. Ar tiksli ar išsami yra jūsų domeno patirtis? Yra daug daugiau atrasti, ką mums sako šis įspūdingas mokymosi su „Alpha Go Zero“ eksperimentas.

„„ Alpha Go “idėja nėra išeiti ir nugalėti žmones, bet iš tikrųjų atrasti, ką reiškia daryti mokslą - kad programa galėtų iš savęs sužinoti, kas yra žinios“, - pasakoja „Silver“ „YouTube“ įraše apie pasiekimas.

„Alpha Go Zero Deep Mind“ komanda tai vadina pirmojo principo mokymu „tabula rasa“.

'Jei galite pasiekti tabula rasa mokydamasis, jūs turite agentą, kurį galima persodinti iš „Go“ žaidimo į bet kurį kitą domeną, ir žaidimo, kuriame dalyvaujate, ypatumus, jūs sugalvojate tokį bendrą algoritmą, kurį galima pritaikyti bet kur “, - sako jis. . Tai yra provokuojanti idėja, kai išplėtote koncepciją. Tiesiog pagalvokite, ką galėtume padaryti naudodamiesi tvirtais mokymosi algoritmais, kurie galėtų sistemingai spręsti sunkias problemas ir mokytis greičiau nei mūsų civilizacijos kolektyvinės žinios. . . dienomis, o ne dešimtmečiais.

Tikėjimo kalno grynoji vertė 2016 m

Kol kas didelis atėmimas yra tas, kad „algoritmai yra daug svarbesni nei skaičiavimas ar turimi duomenys“, - sakė Silver. Vien tai keičia žaidimą, kai priartėjame prie žinomo pasaulio išplėtimo. Nors „Alpha Go“ naudoja apie 25 milijonus dolerių aparatinės įrangos - tai ne visai lengva sistema - žinote, kad AI guru jau seniai dirba kurdami švaresnius, geresnius duomenų rinkinius. Šiandien daugelis didžiųjų duomenų rinkinių laikomi pernelyg triukšmingais - pilni blogų duomenų - norint tiksliai lavinti dirbtinį intelektą. Jei dirbtinis intelektas mokosi iš duomenų, o duomenys yra blogi, jis neišmoksta. Didelė problema.

Kas būtų, jei jums nereikėtų švarių duomenų, o tik patirties, o dirbtinis intelektas galėtų pats treniruotis?

Tai jaudinantis „Alpha Go Zero“ pasiekimas. Nors jis yra nišiniame, taisyklėmis paremtame žaidimų pasaulyje, jis turi didelių pasekmių visose pramonės šakose, dirbant pagal fizines taisykles - galvojant apie chemiją, eismą, biologiją, farmakologiją, keliones, logistiką ir gamybą. Jei mes galime sukurti taip lanksčias taisykles, kad jos galėtų dirbti iš platesnės patirties ir tokios kryptingos, kad visada sukurtų stipresnius įgūdžius, pavyzdžiui, „Alpha Go Zero“, tada įmanoma pasiekti dirbtinį intelektą, kuris valdytų sistemas. Šioms sistemoms nereikėtų jokių išorinių duomenų, neturėtų duomenų valymo problemų ir nereikėtų sulėtinti žmonių ciklo. Iš dalies dėl to „Google“ motininė įmonė „Alphabet“ lažino kompaniją dėl dirbtinio intelekto ir sparčiai investuoja į dirbtinį intelektą. („Amazon“ taip pat investuoja į dirbtinį intelektą, kaip ir į naujausią dirbtinio intelekto įsigijimą „BodyLabs“.)

turi pat rhyme'ui buvo atlikta plastinė operacija

Gilaus proto profesorius Davidas Silveras sako: „Tai, kad mes matėme, kaip programa pasiekė aukšto lygio rezultatų ... turėtų reikšti, kad dabar mes galime pradėti spręsti kai kurias iš labiausiai iššūkių keliančių ir labiausiai paveikiančių žmonijos problemų“.

Šis įrašas buvo atnaujintas siekiant paaiškinti, kad „AI Libratus“ neseniai įveikė geriausius pokerio žaidėjus naudodama strategiją, kuri apima žaidimą savarankiškai, o ne žmogaus įvestus duomenis.