CANON_112024 CANON_112024 CANON_112024

Umelá inteligencia dokáže vytvoriť portrét iba z hlasového záznamu danej osoby

Výskum a vývoj
3
Výskumníci v oblasti umelej inteligencie pracovali na rekonštrukcii tváre človeka len pomocou krátkej zvukovej nahrávky jeho rozprávania a výsledky sú veľmi pôsobivé. Prvé informácie o algoritme AI názvom Speech2Face publikovali výskumníci z Laboratória počítačovej vedy a umelej inteligencie na MIT v článku z roku 2019. Tím najprv navrhol a vycvičil hlbokú neurónovú sieť pomocou miliónov videí z YouTube a internetu, na ktorých sú zachytení hovoriaci ľudia. Počas tohto tréningu sa umelá inteligencia naučila korelácie medzi zvukom hlasu a tým, ako hovoriaci vyzerá. Tieto korelácie jej umožnili čo najlepšie odhadnúť vek, pohlavie a etnický pôvod hovoriaceho. Po vyškolení bola umelá inteligencia pozoruhodne dobrá pri vytváraní portrétov len podľa hlasových záznamov, ktoré sa podobali na to, ako hovoriaci skutočne vyzeral. Na ďalšiu analýzu presnosti rekonštrukcií tváre výskumníci vytvorili „dekodér tváre“, ktorý robí štandardizovanú rekonštrukciu tváre osoby zo statického záberu, pričom i ... Zobrazit Galériu

Redakcia

Všetky autorove články

Mohlo by vás zaujímať

Mohlo by vás zaujímať