DeepSeek V4: nyílt modell, ami az amerikai élmezőnyt célozza

A kínai DeepSeek előzetesben kiadta a V4-es, nyílt forráskódú AI-modelljét, és azt állítja, hogy felveszi a versenyt az OpenAI, a Google és az Anthropic zárt rendszereivel. A cég külön kiemeli a kódolási képességek ugrását és a Huawei-chipekkel való kompatibilitást, miközben a tanítás költségeiről és hardveréről nem közöl részleteket.

Ha eddig azt gondoltad, hogy a csúcskategóriás AI-modellek ligája kizárólag a nagy amerikai szereplők belügye, a DeepSeek most látványosan vitatja ezt. A V4 előzetese egyszerre technológiai üzenet és iparági jelzés: a „nyílt” modell is pályázhat a legjobbak közé.

Mi történt

A kínai DeepSeek pénteken előzetesben (preview) kiadta a következő generációs, V4 nevű AI-modelljét. A cég állítása szerint a nyílt forráskódú modell versenyképes a vezető, zárt forrású amerikai rendszerekkel — konkrétan az Anthropic, a Google és az OpenAI megoldásaival.

A DeepSeek szerint a V4 jelentős előrelépés a korábbi modelljeihez képest, különösen kódolásban. Ez nem véletlen fókusz: a programozási képesség ma már kulcselem az úgynevezett AI-ügynökökben (AI agents) — gondolj rá úgy, mint „digitális gyakornokokra”, akik nemcsak válaszolnak, hanem lépéseket is végrehajtanak (például kódot írnak, hibát keresnek, fájlokat rendeznek). Ez a képesség húzta fel az olyan eszközöket is, mint a ChatGPT Codex vagy a Claude Code.

A bejelentésnek van egy hardveres-iparági rétege is: a DeepSeek külön hangsúlyozza, hogy a V4 kompatibilis a hazai (kínai) Huawei-technológiával. Ez mérföldkőként van tálalva Kína chipipari törekvései szempontjából, vagyis hogy a csúcsközeli AI ne legyen teljesen külső (különösen amerikai) beszállítóktól függő.

A V4 érkezése egy évvel azután történik, hogy a DeepSeek az R1 modellel „megrázta” az amerikai AI-ipart: akkor azt állította, hogy a modellt a vezető amerikai rendszerek költségének töredékéből tanította be. A Verge szerint a DeepSeek most nem közölte sem a V4 tanítási költségeit, sem azt, milyen hardveren tréningezték.

Közben a háttérben tovább élnek a viták: amerikai tisztviselők azzal vádolták a céget, hogy tiltott Nvidia chipeket használt, az Anthropic pedig azt állította, hogy a DeepSeek visszaélt a Claude-dal saját termékeinek fejlesztéséhez.

Miért fontos

A „nyílt forráskódú modell” itt nem csak filozófiai címke. A nyílt modellek általában nagyobb mozgásteret adnak a fejlesztőknek és cégeknek: saját infrastruktúrán futtathatók, testre szabhatók, és jobban beilleszthetők belső rendszerekbe. Gondolj rá úgy, mint a különbségre egy bérelhető, zárt szolgáltatás és egy saját telepítésű szoftver között: más a kontroll, más a kockázat és más a rugalmasság.

A kódolásra kihegyezett fejlődés pedig azért érdekes a hétköznapi felhasználónak is, mert a „kódolni tudó” modellek nem csak programozóknak hasznosak. Ugyanaz a képesség — lépésekre bontás, hibakeresés, struktúrált gondolkodás — sokféle feladatban visszaköszön: automatizálásban, adatfeldolgozásban, vagy akár abban, hogy egy AI megbízhatóbban kövesse az utasításaidat.

Mire figyelj

Valós teljesítmény vs. állítások: a „versenyképes a zárt élmezőnnyel” kijelentés súlyos, de a gyakorlati összevetéshez tipikusan független mérések és széles körű tesztek kellenek.
Átláthatóság a tréningről: a V4 kapcsán a tréningköltségek és a használt hardver hiánya fontos kérdés, különösen a korábbi viták fényében.
Chip- és geopolitikai szál: a Huawei-kompatibilitás hangsúlyozása arra utal, hogy a modell nemcsak szoftvertermék, hanem stratégiai demonstráció is — érdemes figyelni, mennyire lesz ez ténylegesen meghatározó a piaci elterjedésben.
Etikai és jogi viták: a tiltott chipek használatáról szóló vádak és az Anthropic állítása (Claude „visszaélésszerű” használata) befolyásolhatják a DeepSeek nemzetközi megítélését és partnerségeit.