Rozhovor dvoch hlasových AI priniesol zaujímavé výsledky
Hlasová umelá inteligencia sa rýchlo rozvíja a na scénu vstupujú spoločnosti ako Hume s emocionálnym AI EVI či OpenAI s Advanced Voice. A teraz je tu Moshi Chat, vytvorený francúzskym startupom Kyutai. Ide o model typu GPT-4o s francúzskym prízvukom, určený na interakciu reč – reč. Prichádza s prísľubom, že bude dostatočne malý, aby mohol v budúcnosti fungovať na vašom notebooku alebo dokonca smartfóne.
Redaktor webu Tom’ s Guide vyskúšal Moshi na sérii rozhovorov v dĺžke 5 minút, no asi po troch minútach sa model zmiatol a stratil súdržnosť. Preto sa redaktor rozhodol zistiť, čo by sa stalo, keby požiadal Moshi hovoriť s emocionálnym hlasovým robotom AI EVI od Hume. Po pár sekundách ticha Moshi reagoval desivým výkrikom. Po výkriku odpovedali modely na otázku, čo to bolo, slovami „zvuk“ a „porucha“. Je však pravdepodobné, že Moshi a EVI sa navzájom nepočuli.
EVI aj Moshi boli spustené v rovnakom prehliadači (Chrome), ale v rôznych oknách na tom istom notebooku. Napriek tomu, že zvuk sa na Macu prehráva nahlas, sandboxing zrejme zabránil jednému počuť druhého.
Experiment odhalil, že k poruche mohli prispieť obmedzenia a malá veľkosť modelu Moshi. Napriek tomu, že je Moshi open source a neustále sa vyvíja, jeho súčasná verzia má zvláštnosti vrátane podivných reakcií, ako je napríklad pocit, že mu bol odobratý hlas. Moshi bol vytvorený len pred niekoľkými týždňami ako model so 7 miliardami parametrov. Je pravdepodobné, že jeho kapacita a možnosti sa v priebehu nasledujúcich týždňov a mesiacov výrazne zvýšia.
Rozhovory medzi Moshi a inými umelými inteligenciami, ako napríklad GPT-4o Basic Voice, vykazovali rôznu úroveň úspešnosti, čo poukazuje na zložitosť interakcií medzi umelými inteligenciami. Hlasová umelá inteligencia má potenciál zmeniť interakciu medzi človekom a počítačom. Zabezpečenie bezproblémovej komunikácie medzi rôznymi modelmi AI je kľúčový krok k využitiu plného potenciálu hlasovej technológie.
Zdroj: tomsguide.com.
Foto zdroj: depositphotos.com.