
Nový Grok 3 od Elona Muska v niektorých benchmarkoch poráža aj ChatGPT
Grok 3, najnovšia verzia veľkého jazykového modelu (LLM) umelej inteligencie spoločnosti xAI bol trénovaný v Colossus Supercluster v Memphise v Tennessee s použitím 100 000 GPU NVIDIA H100. Podľa Muska cieľom Groku je „porozumieť vesmíru“ a odpovedať na otázky, kde sú mimozemšťania, aký je zmysel života, ako skončí vesmír a ako sa to začalo. Musk vyhlásil, že Grok 3 je rádovo schopnejší ako Grok 2 a že bol vytrénovaný vo veľmi krátkom čase.
Bolo to pravdepodobne možné vďaka obrovskému počtu GPU používaných na paralelné trénovanie. Grok 3 však nie je len jeden LLM, je to rodina niekoľkých modelov, pričom prvými z nich sú Grok 3 a Grok 3 mini. Spoločnosť xAI predviedla aj Grok 3 Reasoning a Grok 3 mini Reasoning, ktoré sú podobné modelom OpenAI 03-mini a DeepSeek R1 a riešia problémy pomocou logického procesu krok za krokom.
Zdroj Foto: xAI
Benchmarky, ktoré vykonal tím xAI, ukazujú, že modely Grok-3 a Grok-3 mini prekonávajú svoju konkurenciu ako Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet a GPT-4o v niekoľkých testoch vrátane matematiky (AIME), vedy (GPQA) a programovania (LCB). Modely uvažovania, ktoré sú prístupné prostredníctvom aplikácie Grok, takisto dosahujú lepšie výsledky ako konkurencia na základe rovnakých referenčných hodnôt. Okrem toho bude mať aplikácia Grok novú funkciu s názvom DeepSearch, ktorá pri položení otázky prehľadá internet a následne všetky informácie destiluje do jednej odpovede. K aplikácii Grok 3 dostali vopred prístup niektorí odborníci, ktorí mohli tieto tvrdenia otestovať.
Napríklad bývalý riaditeľ oddelenia umelej inteligencie spoločnosti Tesla a zakladateľ spoločnosti OpenAI Andrej Karpathy sa podelil o výsledky testov na sociálnej sieti X, pričom uviedol, že Grok 3 + Thinking je podobný modelu o1-pro spoločnosti OpenAI, no je o niečo lepší ako DeepSeek-R1 a Gemini 2.0 Flash Thinking. Grok 3 bude najprv k dispozícii predplatiteľom služby X Premium+. Tí, ktorí chcú získať prístup k pokročilejším funkciám, sa však budú musieť zaregistrovať do služby SuperGrok, ktorá bude údajne stáť približne 30 dolárov mesačne alebo 300 dolárov ročne.
Zdroj: tomshardware.com.
Zdroj Foto: xAI
Zobrazit Galériu