OpenAI verejne spúšťa ostrú verziu generátora videa Sora
Spoločnosť OpenAI vydala Sora Turbo, novú verziu svojho modelu na generovanie videa z textu, ktorú sprístupnila predplatiteľom ChatGPT Plus a Pro prostredníctvom vyhradenej webovej stránky. Model generuje videá s dĺžkou až 20 sekúnd v rozlíšení dosahujúcom 1080p na základe textového alebo obrazového zadania. Open AI oznámil, že Sora bude k dispozícii pre predplatiteľov ChatGPT Plus a Pro v USA a mnohých častiach sveta, ale zatiaľ nie je dostupná v Európe.
Z opatrnosti spoločnosť v súčasnosti obmedzuje schopnosť služby Sora generovať videá ľudí. Platforma blokuje aj obsah zahŕňajúci materiál týkajúci sa sexuálneho zneužívania detí a sexuálne deepfakes. Spoločnosť OpenAI uvádza, že udržiava aktívny monitorovací systém a pred zverejnením vykonala testovanie s cieľom identifikovať potenciálne scenáre zneužitia. Sora prekvapila odborníkov na umelú inteligenciu svojím relatívne kvalitným generovaním, keď ju OpenAI prvýkrát predstavil vo februári.
V uplynulých mesiacoch však rôzne modely na syntézu videa od konkurencie (Veo od Googlu, Runway Gen-3 Alpha, Kling, Minimax či nedávny model s názvom Hunyuan Video) ubrali Sore trochu lesku. Sora umožňuje používateľom vytvárať videá vo viacerých pomeroch strán a obsahuje funkcie na kombinovanie existujúcich zdrojov s obsahom vytvoreným umelou inteligenciou. OpenAI tvrdí, že Sora Turbo spracúva požiadavky na generovanie videa rýchlejšie ako výskumná verzia, ktorá bola predstavená vo februári 2024.
Predplatitelia služby ChatGPT Plus (za 20 USD/mesiac) môžu mesačne vytvoriť až 50 videí v rozlíšení 480p spolu s možnosťou generovať menší počet videí v kvalite 720p. Predplatitelia Pro (za 200 USD/mesiac) získajú rozšírené možnosti vrátane vyššieho rozlíšenia a dlhšieho trvania videa. OpenAI plánuje zaviesť špecializované cenové úrovne začiatkom roka 2025.
Počas podujatia 12 days of OpenAI vývojári Sory predviedli nové rozhranie Explore, ktoré umožňuje ľuďom prechádzať videami vytvorenými inými, aby získali podnetné nápady. Kanál Explore si môže bezplatne prezerať ktokoľvek, ale generovanie videí vyžaduje predplatné. Ukázali aj novú funkciu s názvom Storyboard, ktorá používateľom umožňuje režírovať video s viacerými akciami po jednotlivých snímkach.
OpenAI prvýkrát zverejnil aj systémovú kartu Sora. Obsahuje technické podrobnosti o tom, ako model funguje, a bezpečnostné testy, ktoré vývojári pred týmto vydaním uskutočnili. Spoločnosť implementovala do Sory niekoľko bezpečnostných opatrení. Platforma vkladá metadáta C2PA do všetkých vygenerovaných videí na identifikáciu a overenie pôvodu.
Videá štandardne zobrazujú viditeľné vodoznaky a OpenAI vyvinul interný vyhľadávací nástroj na overenie obsahu generovaného Sorou. Spoločnosť priznala aj technické obmedzenia v aktuálnom vydaní. Model má údajne problémy s fyzikálnymi simuláciami a zložitými akciami s dlhším trvaním.
Tieto typy obmedzení zvyčajne súvisia s tým, aké ukážkové videá boli použité na trénovanie modelov AI. Súčasná generácia modelov AI na generovanie videí má problémy s vytváraním skutočne nových vecí, pretože základná architektúra vyniká v transformácii existujúcich konceptov do nových prezentácií, ale zatiaľ zvyčajne zlyháva pri originálnej tvorbe. Generovanie videí umelou inteligenciou je však len v začiatkoch a technológia sa neustále zlepšuje.
Zdroj: arstechnica.com.
Zdroj Foto: depositphotos.com.