Nový model AI konkuruje DeepSeeku s oveľa menším počtom tréningových údajov

Výskum a vývoj

27.2.2025

Medzinárodný tím výskumníkov z popredných akademických inštitúcií a technologických spoločností predstavil nový uvažujúci model AI, ktorý sa vyrovnal jednému z najsofistikovanejších systémov AI v Číne DeepSeek – a občas ho aj prekonal. OpenThinker-32B, vyvinutý konzorciom Open Thoughts, dosiahol skóre presnosti 90,6 % v benchmarku MATH500, čím prekonal hodnotu 89,4 % dosiahnutú modelom DeepSeek.

Takisto prekonal DeepSeek vo všeobecných úlohách na riešenie problémov, keď dosiahol skóre 61,6 v benchmarku GPQA-Diamond v porovnaní s 57,6 pri DeepSeek. V benchmarku LCBv2 dosiahol solídnych 68,9, čo ukazuje silný výkon v rôznych testovacích scenároch. OpenThinker-32B dopadol o niečo horšie ako DeepSeek v programovaní, kde mal skóre 68,9 bodu oproti 71,2, ale keďže je model open source, všetky tieto skóre sa môžu výrazne zlepšiť, keď ho ľudia začnú zdokonaľovať. Nový model však vyniká svojou efektivitou.

OpenThinker potreboval iba 114 000 tréningových príkladov na dosiahnutie týchto výsledkov, zatiaľ čo DeepSeek ich použil 800 000. Model bol postavený nad LLM Qwen2.5-32B-Instruct spoločnosti Alibaba a podporuje skromné kontextové okno s 16 000 tokenmi, čo je oveľa menej ako súčasné štandardy, ale dosť na to, aby zvládol zložité matematické dôkazy a algoritmické problémy.

OpenThinker-32B prichádza uprostred zintenzívňujúcej sa konkurencie v oblasti umelej inteligencie so schopnosťou uvažovania. Spoločnosť OpenAI nedávno oznámila, že všetky modely nasledujúce po GPT-5 budú obsahovať schopnosti uvažovania. Len o deň neskôr Elon Musk vyzdvihol rozšírené možnosti riešenia problémov modelu Grok-3 od spoločnosti xAI a sľúbil, že to bude doteraz najlepší model uvažovania. A aj spoločnosť Nous Research vydala ďalší model uvažovania s otvoreným zdrojovým kódom DeepHermes, založený na modeli Llama 3.1 od spoločnosti Meta.

Táto oblasť nabrala na obrátkach po tom, čo DeepSeek preukázal výkon porovnateľný s modelom o1 od OpenAI pri výrazne nižších nákladoch. Na rozdiel od spoločnosti Open Thoughts, ktorá sa rozhodla vydať všetko ako open source, vývojový tím DeepSeek uchovával svoje tréningové údaje v súkromí.

Tento kľúčový rozdiel znamená, že vývojári môžu ľahšie pochopiť OpenThinker a reprodukovať jeho výsledky od začiatku, ako by to bolo v prípade DeepSeek, pretože majú prístup ku všetkým kúskom skladačky. OpenThinker je k dispozícii na stiahnutie na HuggingFace. Pre zariadenia nižšej kategórie je dostupný aj menší, menej výkonný model so 7 miliardami parametrov.

Zdroj: decrypt.co.

^{Zdroj Foto: depositphotos.com.}