DeepSeek v3.1: itt a kínai AI forradalom újabb lovasa

A kínai DeepSeek startup 2025. augusztus 21-én bocsátotta útjára hallgatásban legújabb modelljét, a DeepSeek‑V3.1-et, amely több forrás szerint is 685 milliárd paraméterrel rendelkezik.

A model széles körben elérhetővé vált a Hugging Face platformon, nyílt licenc alatt. A technológiai közösség gyorsan rákapott: a DeepSeek‑V3.1 a letöltési listák élére került, és benchmarkokon, mint például az Aider kódolási teszt, kiváló eredményeket mutatott (71,6 %-os teljesítménnyel), amely egyes értékelések szerint 1 %-kal felülmúlta a Claude Opus 4 teljesítményét, miközben 68-szor olcsóbb maradt.

Ha többet akarsz tudni, kövess minket Facebookon!
A cég hivatalos WeChat-bejegyzése szerint a modell rendelkezik egy úgynevezett hybrid inference felépítéssel, mely gyorsabb működést és jobb “ügynök-funkciókat” tesz lehetővé. A DeepSeek sajtóanyagában a modell kéttípusú működési módját hangsúlyozza: a „Think” és „Non‑Think” üzemmódokat (gondolkodó és nem gondolkodó módok), amelyek a válaszadási sebességet és az összetett feladatkezelést optimalizálják.

Továbbá a modell hosszú kontextusablakot kínál, akár 128 000 token felett is működhet, ami több száz oldalnyi szöveg egyszerre elemzését teszi lehetővé VentureBeat. A technológia kompatibilis több numerikus formátummal (BF16, F8_E4M3, F32), így rugalmasan skálázható különféle hardveres környezetben VentureBeat.

A hazai chipgyártók lendülete

A DeepSeek‑V3.1 bejelentése után a kínai félvezető cégek részvényei meredeken emelkedtek – Cambricon Technologies árfolyama 20 %-kal nőtt, míg a SMIC és Hua Hong Semiconductor 10–18 %-os ugrást produkáltak. A piac optimistán értékelte, hogy a DeepSeek a modelljéhez hazai AI-chipeket is támogat, megerősítve Kína technológiai önállósodását.

A modell bevezetésével párhuzamosan a DeepSeek API-használati díjai szeptember 6-tól módosulnak, jelezve a technológia üzleti célú hasznosításának első lépéseit.

Más elemzések szerint a DeepSeek által képviselt nyílt modellstratégia és költséghatékony megközelítés jelentősen feszíti az amerikai techcégek üzleti alapjait. Ugyanakkor aggályokat fogalmaztak meg az adatvédelem, cenzúra és a kínai állami befolyás miatt is, különösen az Európai és brit szakértők részéről.