MagicAnimate a Animate Anyone dokážu roztancovať kohokoľvej iba zo statickej fotky

Výskum a vývoj

12.12.2023

Generatívna AI dokáže vytvárať fotorealistické obrázky, no objavili sa už aj modely, ktoré dokážu generovať videá. Čínske spoločnosti Bytedance a Alibaba teraz ukázali modely, ktoré vytvárajú fotorealistické videoklipy animovaných ľudí. Hoci spoločnosti používajú mierne odlišné architektúry, obe v podstate využívajú difúzne modely prispôsobujúce obrázky modelu, ktorý určuje polohy napríklad tanečnej sekvencie. MagicAnimate od spoločnosti Bytedance a Show Lab na Národnej univerzite v Singapure a Animate Anyone od spoločnosti Alibaba a Inštitútu pre inteligentné výpočty generujú krátke videoklipy tancujúcich ľudí alebo kreslených postavičiek z referenčného obrázka a tanečnej sekvencie. Pomocou metód, ako je ControlNet a technika časovej stability, dosahujú videá oveľa vyššiu konzistenciu ako iné modely na prevod textu na video alebo obrazu na video, pričom prekonávajú súčasný najlepší benchmark takmer o 40 percent. Obe metódy vyžadujú na generovanie videí iba jeden obrázok a jednu pohy ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

MagicAnimate a Animate Anyone dokážu roztancovať kohokoľvej iba zo statickej fotky

Mohlo by vás zaujímať

Mohlo by vás zaujímať

AI už prekonáva virológov a je možné ju zneužiť na vytvorenie biologických zbraní

Deepfake videá už vedia napodobniť aj pulz srdca a môžu byť neodhaliteľné

Koniec ručného retušovania obrázkov. AI Gemini upraví akúkoľvek fotku textovým promptom