Ako funguje učenie neurónových sietí na generovanie textu

Magazín

9.11.2023

Zaujíma vás, ako v pozadí funguje ChatGPT a podobné AI chatboty? Cieľom článku je ukázať, ako sa trénujú modely neurónových sietí na generovanie textu, nazývané aj modely NLP (Natural Language Processing). {{BANNER|SIMPLE_BANNER_HOMEPAGE_2}} Jazykové modely generujú postupnosť znakov, prípadne slov v prirodzenom jazyku. Po natrénovaní na veľkom množstve textu vedia, aké druhy slov za sebou nasledujú v príslušnom jazyku. Zadáme začiatok sekvencie a jazykový model sa snaží dokončiť text. Na pozadí jazykového modelu je neurónová sieť. Ukážeme dva základné princípy fungovania neurónovej siete na generovanie textu. V obidvoch prípadoch sa model neurónovej siete učí na čo najväčšom objeme textu, pričom sa môže učiť buď po jednotlivých znakoch, alebo po celých slovách.