Pozrite sa aký pokrok dosiahla OpenAI Sora v tvorbe hyperrealistických videí
Spoločnosť OpenAI pred pár dňami ohlásila svoj nový model AI Sora, ktorý premieňa opisný text na video a nazvať ho masívnym skokom vpred je príliš slabé vyjadrenie. Sora vytvára „hyper realistické scény“ z textových zadaní, čo znamená, že môžete opísať scénu so všetkými detailmi, na ktorých vám záleží, a ona vytvorí zodpovedajúce video s vysokým rozlíšením.
V tomto smere je podobná mnohým predchádzajúcim generátorom videa, s ktorými sme sa stretli približne za posledný rok ale v neporovnateľne vyššej kvalite. Pozrite sa, aký pokrok dosiahlo OpenAI so svojím novým systémom Sora. Tu je niekoľko príkladov aj so zadaniami, ktoré k nim viedli.
Zadanie: Samojed a pes zlatý retríver sa hravo potulujú nočným futuristickým neónovým mestom. Neónové svetlá vyžarujúce z okolitých budov sa lesknú na ich srsti.
Zadanie: Kamera sleduje biele historické SUV s čiernym strešným nosičom, ako sa rúti po prašnej ceste obklopenej borovicami na strmom horskom svahu, z pneumatík sa dvíha prach, slnečné svetlo svieti na SUV, ako sa rúti po poľnej ceste, a vrhá na scénu teplú žiaru. Cesta sa mierne stáča do diaľky, v dohľade nie sú žiadne iné autá ani vozidlá. Stromy po oboch stranách cesty sú sekvoje, po ktorých sú roztrúsené kúsky zelene. Auto vidieť zozadu, ako s ľahkosťou kopíruje zákrutu, takže sa zdá, akoby bolo na drsnej jazde členitým terénom. Samotná poľná cesta je obklopená strmými kopcami a horami, nad ktorými je jasná modrá obloha s mračnami.
Zadanie: Štýlová žena kráča po tokijskej ulici plnej teplých žiariacich neónov a animovaných mestských nápisov. Na sebe má čiernu koženú bundu, dlhé červené šaty, čierne čižmy a v ruke nesie čiernu kabelku. Na očiach má slnečné okuliare a má červený rúž. Kráča sebavedomo a ležérne. Ulica je vlhká a leskne sa, čo vytvára zrkadlový efekt farebných svetiel. Prechádza sa po nej veľa chodcov.
Fyzika týchto scén funguje neskutočne dobre. Detaily a pohyb sú tak realistické, že by ste si mnohé ľahko pomýlili so skutočnými zábermi, keby ste nehľadali chyby alebo si nevšimli, že ide o realistické zábery niečoho, čo v skutočnosti neexistuje.
Zadanie: Po zasneženej lúke sa blíži niekoľko obrovských srstnatých mamutov, ich dlhá vlnitá srsť pri chôdzi zľahka povieva vo vetre, v diaľke sú zasnežené stromy a dramatické snehom posypané hory, popoludňajšie svetlo s mračnami a slnko vysoko v diaľke vytvárajú teplú žiaru, pohľad z nízkej kamery je ohromujúci, zachytáva veľké chlpaté cicavce na krásnej fotografii s hĺbkou ostrosti.
Podľa OpenAI môže Sora aj ukladať postavy, miesta a štýly, aby sa dali použiť vo viacerých scénach, čo ukazuje, že to nakoniec smeruje: k schopnosti generovať celé príbehy, relácie alebo filmy.
Zadanie: Príbeh o živote robota v kyberpunkovom prostredí.
Na druhej strane je tu stále veľa priestoru na zlepšenie a ako pri všetkých kreatívnych systémoch AI aj tu môžu byť výsledky zvláštne, najmä ak požadujete niečo obzvlášť absurdné.
Zadanie: Archeológovia objavia v púšti bežnú plastovú stoličku, s veľkou starostlivosťou ju vykopú a oprášia.
A niekedy môže prísť s nečakane umeleckým prekvapením alebo aj s dvoma.
Zadanie: Nádherné domáce video zobrazujúce obyvateľov Lagosu v Nigérii v roku 2056. Nakrútené kamerou mobilného telefónu.
OpenAI hovorí, že teraz je Sora vo fáze red teamingu (termín z oblasti kybernetickej bezpečnosti označujúci techniku útoku používanú na testovanie toho, ako by organizácia reagovala na skutočný kybernetický útok). To znamená, že dostáva neprístojné zadania a tím sa ju snaží prinútiť robiť veci, ktoré nie sú povolené, aby bolo možné zablokovať všetky známe spôsoby, ako to dosiahnuť. Vďaka tomu bude Sora možno trochu pokrivená, ale viac v súlade s autorskými právami a bude menej pravdepodobné, že bude generovať „nebezpečný“ obsah.
Zadanie: Letecký pohľad na Santorini počas modrej hodiny (pozn: čas svitania alebo súmraku), ktorý ukazuje úžasnú architektúru bielych kykladských budov s modrými kupolami. Výhľad na kalderu je úchvatný a osvetlenie vytvára krásnu, pokojnú atmosféru.
Zdroj: newatlas.com.