Čínska AI model DeepSeek zamotal hlavu americkej konkurencii OpenAI a Google

Výskum a vývoj
0

Spoločnosť DeepSeek, pomerne neznámy čínsky startup v oblasti umelej inteligencie, vyvolala v Silicon Valley šok svojím nedávnym vydaním špičkových modelov umelej inteligencie. Tieto modely, vyvinuté s pozoruhodnou účinnosťou a ponúkané ako open source zdroje, spochybňujú dominanciu zavedených hráčov, ako sú OpenAI, Google a Meta.

DeepSeek, ktorý v máji 2023 založil Liang Wenfeng, významná osobnosť v odvetví hedžových fondov aj AI, funguje nezávisle, ale je financovaný výlučne High-Flyer, kvantitatívnym hedžovým fondom, ktorý takisto založil Wenfeng. Tím DeepSeek pozostáva predovšetkým z mladých, talentovaných absolventov špičkových čínskych univerzít, ktorí podporujú kultúru inovácií. Je pozoruhodné, že náborové postupy spoločnosti uprednostňujú technické schopnosti pred tradičnými pracovnými skúsenosťami, výsledkom čoho je tím vysoko kvalifikovaných jednotlivcov s novým pohľadom na vývoj AI.

Cesta spoločnosti DeepSeek sa začala v novembri 2023 vydaním aplikácie DeepSeek Coder, modelu s otvoreným zdrojovým kódom určeného na programovacie úlohy. Po ňom nasledoval DeepSeek LLM, model s 67 miliardami parametrov, ktorého cieľom je konkurovať iným veľkým jazykovým modelom. DeepSeek-V2, uvedený na trh v máji 2024, si získal značnú pozornosť pre svoj vysoký výkon a nízke náklady. Jeho cenová stratégia prinútila ďalšie veľké čínske technologické giganty, ako sú ByteDance, Tencent, Baidu a Alibaba, znížiť ceny svojich modelov AI, aby zostali konkurencieschopnými.

DeepSeek-V2 bol nahradený modelom DeepSeek-Coder-V2, čo je pokročilejší model s 236 miliardami parametrov, zameraný na riešenie zložitých programovacích úloh. Tento model podporuje veľkú dĺžku kontextu až do 128K tokenov a je k dispozícii prostredníctvom nákladovo efektívneho API, pričom cena je stanovená na 0,14 USD za milión vstupných tokenov a 0,28 USD za milión výstupných tokenov.

K PREDPLATNÉMU DOSTANEŠ DARČEKY!

Najnovšie modely spoločnosti, DeepSeek-V3 a DeepSeek-R1, ďalej upevňujú jej vplyv na oblasť umelej inteligencie. DeepSeek-V3 obsahuje 671 miliárd parametrov, pričom vykazuje vysoký výkon na rôznych benchmarkoch a zároveň potrebuje menej zdrojov ako podobné modely. DeepSeek-R1, uvedený na trh v januári 2025, kladie dôraz na úlohy uvažovania a predvádzaním pokročilých funkcií konkuruje modelu o1 spoločnosti OpenAI.

DeepSeek má aj tzv. destilované modely, známe ako DeepSeek-R1-Distill, ktoré vychádzajú z populárnych modelov open-weight a sú doladené na syntetických údajoch z R1. Tieto modely ponúkajú rôzne úrovne výkonu, ktoré vyhovujú rôznym výpočtovým potrebám.

Napriek rýchlemu úspechu sa DeepSeek zameriava najmä na výskum a nemá bezprostredné plány na rozsiahlu komercializáciu. Spoločnosť ťaží zo strategických partnerstiev, najmä so spoločnosťou AMD, ktorá poskytuje vysokovýkonný výpočtový hardvér a softvér na vývoj modelov. Táto spolupráca umožňuje spoločnosti DeepSeek zvýšiť výkon a škálovateľnosť.

Úspechy spoločnosti DeepSeek vyplývajú z kľúčových inovácií, medzi ktoré patria:

1. Učenie s posilňovaním (Reinforcement Learning – RL): Táto metóda umožňuje modelom učiť sa na základe interakcií, a nie výlučne na základe dolaďovania pod dohľadom. Tento prístup zlepšil schopnosti uvažovania DeepSeek-R1.

2. Architektúra Mixture-of-Experts (MoE): Táto architektúra umožňuje aktivovať pre každú úlohu len špecifické parametre, čím sa zvyšuje efektívnosť a výrazne znižujú náklady.

3. Multi-Head Latent Attention (MLA): Táto funkcia pomáha modelu efektívnejšie spracovať údaje tým, že mu umožňuje zamerať sa na viacero aspektov vstupných údajov súčasne.

4. Techniky destilácie: Tieto techniky umožňujú väčším modelom odovzdávať svoje znalosti menším, efektívnejším modelom, čím sa výkonná umelá inteligencia sprístupňuje širšiemu publiku.

Nákladovo efektívne stratégie spoločnosti DeepSeek sú zvýraznené zníženými nákladmi na školenie a dostupnými cenami API, vďaka čomu sú nástroje AI dostupné aj menším podnikom. Prístup modelu open source navyše minimalizuje finančné prekážky a podporuje širšie využívanie pokročilých technológií AI.

DeepSeek vytvoril významnú konkurenciu pre zavedené spoločnosti, ako sú OpenAI a Google, a podnietil ich k prehodnoteniu svojich cien a ponúk. Záväzok spoločnosti k open source modelom demokratizuje prístup k nástrojom AI, čím podporuje inovácie v rôznych skupinách používateľov.

Zdroj: forbes.com.

Zdroj Foto: depositphotos.com.

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať