
Google Gemini Robotics zrýchli vývoj humanoidných robotov
Najnovší model Google Gemini Robotics posúva generatívnu AI do fyzického sveta a mohol by podstatne urýchliť preteky vo vývoji humanoidných robotov. Gemini Robotics, predstavený laboratóriom DeepMind spoločnosti Google, zlepšuje schopnosti Gemini v troch kľúčových oblastiach: obratnosť, interaktivita a zovšeobecňovanie. Každý z týchto troch aspektov významne ovplyvňuje úspech robotiky na pracovisku a v neznámych prostrediach.
Zovšeobecňovanie umožní robotovi získať rozsiahle znalosti Gemini o svete a veciach, aplikovať ich na nové situácie a plniť úlohy, na ktoré nebol nikdy trénovaný. Roboty Google Gemini Robotics sú aj interaktívnejšie a dokážu reagovať nielen na meniace sa slovné zadania, ale aj na nepredvídateľné podmienky. Vo videu výskumníci požiadali robota, aby vložil hrozno do misky s banánmi, ale potom misku premiestňovali, zatiaľ čo robotické rameno sa prispôsobovalo a stále dokázalo vložiť hrozno do misky.
Google predviedol obratnosť robota, ktorá mu umožnila riešiť také úlohy, ako je hranie piškvoriek na drevenej doske či skladanie papiera do origami. Namiesto hodín tréningu na každú úlohu reagujú roboty na takmer neustále pokyny v prirodzenom jazyku a vykonávajú úlohy bez usmerňovania.
Hoci väčšina z toho, čo Google ukázal vo videách, boli len robotické ruky a ramená, ktoré vykonávali širokú škálu fyzických úloh, existujú aj väčšie plány. Google spolupracuje so spoločnosťou Apptroniks, aby pridala nový model do svojho humanoidného robota Apollo. Google to spojí s novým pokročilým modelom vizuálneho jazyka s názvom Gemini Robotics-ER (embodied reasoning).
Gemini Robotics-ER zlepší priestorové uvažovanie robotov a mal by pomôcť vývojárom robotov pripojiť modely k existujúcim ovládačom. To by malo ďalej zlepšiť uvažovanie za pochodu a umožniť robotom rýchlo zistiť, ako uchopiť a používať neznáme predmety.
Google nazýva Gemini Rotbotics ER komplexným riešením a tvrdí, že „dokáže vykonať všetky kroky potrebné na ovládanie robota hneď po vybalení z krabice vrátane vnímania, odhadovania stavu, priestorového chápania, plánovania a generovania kódu“. Spoločnosť poskytuje model Gemini Robotics -ER niekoľkým robotickým firmám zameraným na podnikanie a výskum vrátane Boston Dynamics (tvorcovia robota Atlas), Agile Robots a Agility Robots.
Zdroj: techradar.com.
Zdroj Foto: Google