S_1124_Flexcam Advertisement S_1124_Flexcam S_1124_Flexcam Advertisement

Syntetický hlas už dokáže aj mľaskať, šušlať či dýchať. Ukážky vás prekvapia.

0
Počítače dnes zvládnu generovanie reči z kúskov textu. Už sme si zvykli, že sa nám prihovára navigácia v aute či hlasový asistent v mobile. Tento softvér zostavuje vety z hlasových nahrávok, ktoré bolo treba zhotoviť v štúdiu. Výsledok si však sotva zmýlite s bežnou ľudskou rečou. Teraz výskumníci z Alphabet DeepMind použili úplne odlišný prístup. Staršie systémy TTS (text-to-speech)  využívajú rozsiahlu knižnicu častí reči (foném a morfém) a veľké súbory pravidiel, ktoré opisujú všetky spôsoby kombinovania písmen, aby vznikol príslušný zvuk. Spájaním alebo zreťazením takýchto kúskov sa vytvára funkčná syntetická reč. V tomto prípade ide o konkatenatívnu technológiu TTS. Pri parametrickej technológii TTS sa syntetický hlas generuje pomocou počítačového modelu a zvukového generátora, tzv. vokodéra.Narábať sa dá s mnohými slovami, aj keď reč má nepresvedčivú kadenciu a tón.  Nový systém WaveNet zachádza ďalej. Dokáže generovať akýkoľvek 16 kHz zvuk, ktorý sa naučí. Vedci nakŕmili konvo ... Zobrazit Galériu

Redakcia

Všetky autorove články
WaveNet

Mohlo by vás zaujímať

Mohlo by vás zaujímať