
Kvantový počítač dokázal výrazne efektívnejšie natrénovať model AI
Čínski vedci tvrdia, že dosiahli svetové prvenstvo v používaní skutočného kvantového počítača na doladenie modelu umelej inteligencie (AI) s 1 miliardou parametrov, čo ukazuje potenciál kvantových počítačov pomôcť lepšie trénovať veľké jazykové modely. Pomocou Origin Wukong, čínskeho supravodivého kvantového počítača tretej generácie so 72 qubitmi, tím v Hefei dosiahol 8,4-percentné zlepšenie tréningového výkonu pri súčasnom znížení počtu parametrov o 76 percent.
Je to prvýkrát, čo bol skutočný kvantový počítač použitý na doladenie veľkého jazykového modelu v praktickom prostredí. Zlepšený model AI údajne priniesol lepšie výsledky pri konkrétnych úlohách. Keď sa trénoval na konverzačných údajoch o duševnom zdraví, urobil o 15 percent menej chýb a v teste na riešenie matematických problémov sa jeho presnosť zvýšila zo 68 na 82 percent.
Jemné doladenie je kľúčový krok pri prispôsobovaní všeobecných modelov umelej inteligencie, ako je DeepSeek alebo Qwen, na špecializované úlohy, napríklad na analýzu lekárskych údajov. Tento proces sa tradične spolieha na výkonné servery a čelí viacerým problémom vrátane obmedzenej schopnosti škálovania a vysokej spotreby energie. Naopak, kvantové počítače prinášajú jedinečné výhody.
Využitím kvantových princípov, ako je superpozícia (jedna častica má súčasne viacero možných stavov) a prepojenosť čiže entanglement (čo znamená, že častice zostávajú prepojené a okamžite sa navzájom ovplyvňujú), môžu kvantové počítače skúmať obrovské kombinácie parametrov súčasne, vďaka čomu je tréning umelej inteligencie oveľa rýchlejší a efektívnejší.
Aby to bolo možné, výskumníci zo spoločnosti Origin Quantum, startupu so sídlom v Hefei, ktorý vyvinul počítač Origin Wukong, pracovali na vytvorení novej metódy nazvanej kvantovo vážené hybridné ladenie parametrov tenzorov. Pri tomto prístupe sa nastavenia modelu umelej inteligencie, nazývané váhy, spracúvajú pomocou siete, ktorá kombinuje kvantové a klasické techniky. Kvantová časť identifikuje zložité vzory v údajoch, zatiaľ čo klasická časť komprimuje model, aby sa použil menší výpočtový výkon.
Podľa Doua Menghana, viceprezidenta spoločnosti Origin Quantum, dokáže jedna dávka tréningových údajov AI na čipe Wukong spustiť stovky paralelných kvantových úloh, čo dokazuje schopnosť čipu zvládnuť intenzívne pracovné zaťaženie. Origin Wukong, uvedený na trh v januári 2024, patrí v súčasnosti medzi najpokročilejšie programovateľné a komerčne dostupné supravodivé kvantové počítače na svete.
Zdroj: scmp.com.
Zdroj Foto: depositphotos.com.