Umelá inteligencia DeepMind Dreamer sa učí podľa minulosti predpovedať budúcnosť
Niektoré systémy umelej inteligencie dosahujú ciele na základe minulých skúseností. Zovšeobecňujú ich na nové situácie a prostredia, s ktorými sa predtým nestretli. Ukázalo sa, že reinforcement learning, učenie posilňovaním (výcviková metóda, ktorá používa odmeny na podporu softvérových taktík smerujúcich k cieľu), je zvlášť vhodná metóda na pochopenie modelov sveta, ktoré sumarizujú skúsenosti agenta a rozširujú ich na uľahčenie učenia sa novému správaniu.
Vedci z laboratória DeepMind a z Torontskej univerzity sa to snažili využiť s agentom Dreamer, navrhnutým na osvojenie si modelu sveta a plánovanie výberu akcií „predstavením si“ ich dlhodobých dôsledkov. Hovoria, že to nielenže funguje pre akýkoľvek učebný cieľ, ale že Dreamer prekonáva existujúce prístupy v oblasti dátovej efektívnosti a času výpočtu, ako aj výkonu.
Dreamer sa po celý čas učí model latentnej dynamiky na predvídanie odmien za akcie a pozorovania. Latentným dynamickým modelom sa v tomto kontexte rozumie model, k ...
Článok je uzamknutý
Prihlásiť pomocou členstva NEXTECH
Zobrazit Galériu
Článok je uzamknutý
Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU
Prihlásiť pomocou členstva NEXTECH