ROG Zephyrus ROG Zephyrus ROG Zephyrus

Rozhovor dvoch hlasových AI priniesol zaujímavé výsledky

Technológie
1

Hlasová umelá inteligencia sa rýchlo rozvíja a na scénu vstupujú spoločnosti ako Hume s emocionálnym AI EVI či OpenAI s Advanced Voice. A teraz je tu Moshi Chat, vytvorený francúzskym startupom Kyutai. Ide o model typu GPT-4o s francúzskym prízvukom, určený na interakciu reč – reč. Prichádza s prísľubom, že bude dostatočne malý, aby mohol v budúcnosti fungovať na vašom notebooku alebo dokonca smartfóne. 

Redaktor webu Tom’ s Guide vyskúšal Moshi na sérii rozhovorov v dĺžke 5 minút, no asi po troch minútach sa model zmiatol a stratil súdržnosť. Preto sa redaktor rozhodol zistiť, čo by sa stalo, keby požiadal Moshi hovoriť s emocionálnym hlasovým robotom AI EVI od Hume. Po pár sekundách ticha Moshi reagoval desivým výkrikom. Po výkriku odpovedali modely na otázku, čo to bolo, slovami „zvuk“ a „porucha“. Je však pravdepodobné, že Moshi a EVI sa navzájom nepočuli.

EVI aj Moshi boli spustené v rovnakom prehliadači (Chrome), ale v rôznych oknách na tom istom notebooku. Napriek tomu, že zvuk sa na Macu prehráva nahlas, sandboxing zrejme zabránil jednému počuť druhého.

Experiment odhalil, že k poruche mohli prispieť obmedzenia a malá veľkosť modelu Moshi. Napriek tomu, že je Moshi open source a neustále sa vyvíja, jeho súčasná verzia má zvláštnosti vrátane podivných reakcií, ako je napríklad pocit, že mu bol odobratý hlas. Moshi bol vytvorený len pred niekoľkými týždňami ako model so 7 miliardami parametrov. Je pravdepodobné, že jeho kapacita a možnosti sa v priebehu nasledujúcich týždňov a mesiacov výrazne zvýšia.

Rozhovory medzi Moshi a inými umelými inteligenciami, ako napríklad GPT-4o Basic Voice, vykazovali rôznu úroveň úspešnosti, čo poukazuje na zložitosť interakcií medzi umelými inteligenciami. Hlasová umelá inteligencia má potenciál zmeniť interakciu medzi človekom a počítačom. Zabezpečenie bezproblémovej komunikácie medzi rôznymi modelmi AI je kľúčový krok k využitiu plného potenciálu hlasovej technológie.

Zdroj: tomsguide.com.

Foto zdroj: depositphotos.com.

Redakcia

Všetky autorove články

1 komentár

má budúcnosť reakcia na: Rozhovor dvoch hlasových AI priniesol zaujímavé výsledky

17.7.2024 21:07
Určite bude zaujímavé, či niektorá z AI odhalí, že komunikuje s entitou, ktorá nemá vedomie.
Črtá sa perspektívny smer vo výzkume v behaviorálnej psychológii - mohlo by mať veľký dopad na komputerizáciu výroby a spoločnosti.
Reagovať

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať