Video s rapujúcou Monou Lisou sa stalo virálnym
Najnovší počin Microsoftu v oblasti umelej inteligencie pohol svetom digitálnej animácie. Jeho nový AI nástroj VASA-1 dokáže premeniť statické zábery tvárí ľudí na živé animované klipy. Jedna z najpútavejších ukážok schopností VASA-1 prichádza v podobe ikonickej Mony Lisy rapujúcej pieseň Paparazzi. Tajomná žena zvečnená v majstrovskom diele Leonarda da Vinciho si teraz počína ako ostrieľaná rapová hviezda.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
Je ohromujúce, ako hladko VASA-1 synchronizuje pohyby pier so zvukom, čím vytvára neskutočný pocit autenticity. Navyše jemné nuansy mimiky a prirodzené pohyby hlavy vdýchnu animácii život. Na sociálnych sieťach sa šírilo aj niekoľko ďalších videí, ktoré spoločnosť zverejnila.
4. Out-of-distribution generalization - singing audios pic.twitter.com/h7BvTq4vAE
Podľa vyjadrenia Microsoftu VASA-1 neposkytuje len vysokokvalitný videovýstup, ale podporuje aj online generovanie videí s pôsobivým rozlíšením a snímkovou frekvenciou. To znamená, že aj tie najzložitejšie detaily animácie sú vykreslené s vysokou presnosťou a plynulosťou. Za zmienku však stojí, že Microsoft zatial neuvolnil produkt na verejné použitie s odvolaním sa na jeho potenciálne zneužitie.
Zdroj: in.mashable.com.