ACER_112024 ACER_112024 ACER_112024

Umelá inteligencia DeepMind Dreamer sa učí podľa minulosti predpovedať budúcnosť

Technológie
0
Niektoré systémy umelej inteligencie dosahujú ciele na základe minulých skúseností. Zovšeobecňujú ich na nové situácie a prostredia, s ktorými sa predtým nestretli. Ukázalo sa, že reinforcement learning, učenie posilňovaním (výcviková metóda, ktorá používa odmeny na podporu softvérových taktík smerujúcich k cieľu), je zvlášť vhodná metóda na pochopenie modelov sveta, ktoré sumarizujú skúsenosti agenta a rozširujú ich na uľahčenie učenia sa novému správaniu. Vedci z laboratória DeepMind a z Torontskej univerzity sa to snažili využiť s agentom Dreamer, navrhnutým na osvojenie si modelu sveta a plánovanie výberu akcií „predstavením si“ ich dlhodobých dôsledkov. Hovoria, že to nielenže funguje pre akýkoľvek učebný cieľ, ale že Dreamer prekonáva existujúce prístupy v oblasti dátovej efektívnosti a času výpočtu, ako aj výkonu. Dreamer sa po celý čas učí model latentnej dynamiky na predvídanie odmien za akcie a pozorovania. Latentným dynamickým modelom sa v tomto kontexte rozumie model, k ... Zobrazit Galériu

Redakcia

Všetky autorove články
umelá inteligencia AI buducnost stroj technika NVIDIA vykon cip pamat

Mohlo by vás zaujímať

Mohlo by vás zaujímať