„GOOGLE“ DIRBTINIO INTELEKTO „ALPHA GO ZERO“ TIESIOG PASPAUDUS „RESET“, KAIP IŠMOKTI

Pamenate (neaiškiai), kaip išmokote vaikščioti, kalbėtis, važiuoti dviračiu ar vairuoti? Tai buvo netvarkinga ir pilna klaidų, tačiau įgūdžiai, kuriuos taip išmokai, išliko. Už gyvenamųjų sistemų ribų buvo sudėtinga sukurti pakankamai stiprius algoritmus, kad būtų galima įgyti „tikrojo gyvenimo patirtį“ ir sukurti lipnų, prisitaikantį elgesį dirbtiniam intelektui.

Na, „Alpha Go Zero“ tai tiesiog padarė.

„Tai prasideda nuo tuščio lapo ir išsiaiškina tik sau, tik iš savęs žaidimo ir be jokios žmogaus žinios, jokių žmogaus duomenų, bruožų, pavyzdžių ar žmonių įsikišimo. Iš pirmųjų principų sužinoma, kaip žaisti „Go“ žaidimą “, - sako„ DeepMind “profesorius Davidas Silveras.

Dirbtinis intelektas turėjo keletą pakartojimų, kiekvienas iš jų buvo protingesnis ir pajėgesnis nei anksčiau. Ankstesnėje versijoje buvo naudojama didžiulė ankstesnių žaidimų duomenų bazė kartu su daugybe algoritmų, kurie nukreipė jį į pergalę. Toks požiūris privertė nugalėti valdantį pasaulio čempioną profesionalų „Go“ žaidėją. Pokeryje „AI Libratus“ neseniai nulupo geriausius pasaulio pokerio žaidėjus beveik 2 milijonais dolerių, taip pat mokydamasis savarankiškai, o ne žmogaus žaidimo duomenimis.

Dawn Davenport ir Johanas Kokas

Dabar šioje naujausioje „Alpha Go“ versijoje mokyta dirbtinio intelekto programos pats kaip žaisti „Go“ - be žmogaus fono.

Vykdant milijonus žaidimų modeliavimo prieš save, prireikė 40 dienų, kol jis išmoko - nuo nulio - kaip įveikti patį pasaulio čempiono variantą. Tai tikrai keičia žaidimą ne tik „Go“, bet ir tai, kaip atrandamos naujos žinios. Ar tiksli ar išsami yra jūsų domeno patirtis? Yra daug daugiau atrasti, ką mums sako šis įspūdingas mokymosi su „Alpha Go Zero“ eksperimentas.

„„ Alpha Go “idėja nėra išeiti ir nugalėti žmones, bet iš tikrųjų atrasti, ką reiškia daryti mokslą - kad programa galėtų iš savęs sužinoti, kas yra žinios“, - pasakoja „Silver“ „YouTube“ įraše apie pasiekimas.

„Alpha Go Zero Deep Mind“ komanda tai vadina pirmojo principo mokymu „tabula rasa“.

'Jei galite pasiekti tabula rasa mokydamasis, jūs turite agentą, kurį galima persodinti iš „Go“ žaidimo į bet kurį kitą domeną, ir žaidimo, kuriame dalyvaujate, ypatumus, jūs sugalvojate tokį bendrą algoritmą, kurį galima pritaikyti bet kur “, - sako jis. . Tai yra provokuojanti idėja, kai išplėtote koncepciją. Tiesiog pagalvokite, ką galėtume padaryti naudodamiesi tvirtais mokymosi algoritmais, kurie galėtų sistemingai spręsti sunkias problemas ir mokytis greičiau nei mūsų civilizacijos kolektyvinės žinios. . . dienomis, o ne dešimtmečiais.

Tikėjimo kalno grynoji vertė 2016 m

Kol kas didelis atėmimas yra tas, kad „algoritmai yra daug svarbesni nei skaičiavimas ar turimi duomenys“, - sakė Silver. Vien tai keičia žaidimą, kai priartėjame prie žinomo pasaulio išplėtimo. Nors „Alpha Go“ naudoja apie 25 milijonus dolerių aparatinės įrangos - tai ne visai lengva sistema - žinote, kad AI guru jau seniai dirba kurdami švaresnius, geresnius duomenų rinkinius. Šiandien daugelis didžiųjų duomenų rinkinių laikomi pernelyg triukšmingais - pilni blogų duomenų - norint tiksliai lavinti dirbtinį intelektą. Jei dirbtinis intelektas mokosi iš duomenų, o duomenys yra blogi, jis neišmoksta. Didelė problema.

Kas būtų, jei jums nereikėtų švarių duomenų, o tik patirties, o dirbtinis intelektas galėtų pats treniruotis?

Tai jaudinantis „Alpha Go Zero“ pasiekimas. Nors jis yra nišiniame, taisyklėmis paremtame žaidimų pasaulyje, jis turi didelių pasekmių visose pramonės šakose, dirbant pagal fizines taisykles - galvojant apie chemiją, eismą, biologiją, farmakologiją, keliones, logistiką ir gamybą. Jei mes galime sukurti taip lanksčias taisykles, kad jos galėtų dirbti iš platesnės patirties ir tokios kryptingos, kad visada sukurtų stipresnius įgūdžius, pavyzdžiui, „Alpha Go Zero“, tada įmanoma pasiekti dirbtinį intelektą, kuris valdytų sistemas. Šioms sistemoms nereikėtų jokių išorinių duomenų, neturėtų duomenų valymo problemų ir nereikėtų sulėtinti žmonių ciklo. Iš dalies dėl to „Google“ motininė įmonė „Alphabet“ lažino kompaniją dėl dirbtinio intelekto ir sparčiai investuoja į dirbtinį intelektą. („Amazon“ taip pat investuoja į dirbtinį intelektą, kaip ir į naujausią dirbtinio intelekto įsigijimą „BodyLabs“.)

turi pat rhyme'ui buvo atlikta plastinė operacija

Gilaus proto profesorius Davidas Silveras sako: „Tai, kad mes matėme, kaip programa pasiekė aukšto lygio rezultatų ... turėtų reikšti, kad dabar mes galime pradėti spręsti kai kurias iš labiausiai iššūkių keliančių ir labiausiai paveikiančių žmonijos problemų“.

Šis įrašas buvo atnaujintas siekiant paaiškinti, kad „AI Libratus“ neseniai įveikė geriausius pokerio žaidėjus naudodama strategiją, kuri apima žaidimą savarankiškai, o ne žmogaus įvestus duomenis.

„Google“ dirbtinio intelekto „Alpha Go Zero“ tiesiog paspaudus „Reset“, kaip išmokti

Jūsų Horoskopas Rytojui

Na, „Alpha Go Zero“ tai tiesiog padarė.

Dabar šioje naujausioje „Alpha Go“ versijoje mokyta dirbtinio intelekto programos pats kaip žaisti „Go“ - be žmogaus fono.

„Alpha Go Zero Deep Mind“ komanda tai vadina pirmojo principo mokymu „tabula rasa“.

Kas būtų, jei jums nereikėtų švarių duomenų, o tik patirties, o dirbtinis intelektas galėtų pats treniruotis?

Rekomenduojama

Bobas Sagetas Bio

Pirmosios 5 „Microsoft“ paviršiaus pristatymo minutės apėmė 4 ekspertų viešojo kalbėjimo įgūdžius

Emily Compagno Bio

Įdomios Straipsniai

Kas yra 13 metų aktorė Saniyya Sidney? Tėvai, broliai ir seserys, turtas

Kiek turtingas yra Albertas DePrisco? Grynoji vertė, žmona Lisa Niemi, Wiki

Verslus obuolys nenukrenta toli nuo medžio

8 verslo taktikos, kurios ėmėsi J.K. Rowling iš rašytojo į milijonierių

Dana Perino Bio

Norite vėl įsimylėti savo partnerį? Mokslas sako jiems užduoti šiuos 36 klausimus

Surengiau virtualų gimtadienio vakarėlį ir atėjo 46 žmonės. Štai ką aš sužinojau

Lance'o Stewarto buvusi Lizzy Wurst Wiki. Su kuo ji dabar draugauja?

10 metų „Stebuklas Hudsone“ jubiliejus: kaip pilotas ir jo įgula panaudojo 208 sekundes, kad išgelbėtų daugiau nei 100 gyvybių

Ši juoda mama paleido, užaugino ir pardavė daugybės milijonų dolerių vertės grožio prekės ženklą. Štai jos patarimai pradedantiesiems šiandien

Kas yra Carnie Wilson? Dabartinis svoris, grynoji vertė, vyras

Nauji tyrimai atskleidžia, kad daugiau vartotojų kasdien apsiperka kasdienius daiktus

Kaip „ZocDoc“ naudojasi „Zappos“ požiūriu į klientų aptarnavimą

4 „Amazon“ milijardinio dolerio „Twitch“ pasiūlymai

Neišsakyta tiesa apie Maxo Josepho žmoną - Priscilą Joseph