Mi történt
A kínai DeepSeek pénteken előzetesben (preview) kiadta a következő generációs, V4 nevű AI-modelljét. A cég állítása szerint a nyílt forráskódú modell versenyképes a vezető, zárt forrású amerikai rendszerekkel — konkrétan az Anthropic, a Google és az OpenAI megoldásaival.A DeepSeek szerint a V4 jelentős előrelépés a korábbi modelljeihez képest, különösen kódolásban. Ez nem véletlen fókusz: a programozási képesség ma már kulcselem az úgynevezett AI-ügynökökben (AI agents) — gondolj rá úgy, mint „digitális gyakornokokra”, akik nemcsak válaszolnak, hanem lépéseket is végrehajtanak (például kódot írnak, hibát keresnek, fájlokat rendeznek). Ez a képesség húzta fel az olyan eszközöket is, mint a ChatGPT Codex vagy a Claude Code.
A bejelentésnek van egy hardveres-iparági rétege is: a DeepSeek külön hangsúlyozza, hogy a V4 kompatibilis a hazai (kínai) Huawei-technológiával. Ez mérföldkőként van tálalva Kína chipipari törekvései szempontjából, vagyis hogy a csúcsközeli AI ne legyen teljesen külső (különösen amerikai) beszállítóktól függő.
A V4 érkezése egy évvel azután történik, hogy a DeepSeek az R1 modellel „megrázta” az amerikai AI-ipart: akkor azt állította, hogy a modellt a vezető amerikai rendszerek költségének töredékéből tanította be. A Verge szerint a DeepSeek most nem közölte sem a V4 tanítási költségeit, sem azt, milyen hardveren tréningezték.
Közben a háttérben tovább élnek a viták: amerikai tisztviselők azzal vádolták a céget, hogy tiltott Nvidia chipeket használt, az Anthropic pedig azt állította, hogy a DeepSeek visszaélt a Claude-dal saját termékeinek fejlesztéséhez.
Miért fontos
A „nyílt forráskódú modell” itt nem csak filozófiai címke. A nyílt modellek általában nagyobb mozgásteret adnak a fejlesztőknek és cégeknek: saját infrastruktúrán futtathatók, testre szabhatók, és jobban beilleszthetők belső rendszerekbe. Gondolj rá úgy, mint a különbségre egy bérelhető, zárt szolgáltatás és egy saját telepítésű szoftver között: más a kontroll, más a kockázat és más a rugalmasság.A kódolásra kihegyezett fejlődés pedig azért érdekes a hétköznapi felhasználónak is, mert a „kódolni tudó” modellek nem csak programozóknak hasznosak. Ugyanaz a képesség — lépésekre bontás, hibakeresés, struktúrált gondolkodás — sokféle feladatban visszaköszön: automatizálásban, adatfeldolgozásban, vagy akár abban, hogy egy AI megbízhatóbban kövesse az utasításaidat.
Mire figyelj
- Valós teljesítmény vs. állítások: a „versenyképes a zárt élmezőnnyel” kijelentés súlyos, de a gyakorlati összevetéshez tipikusan független mérések és széles körű tesztek kellenek.
- Átláthatóság a tréningről: a V4 kapcsán a tréningköltségek és a használt hardver hiánya fontos kérdés, különösen a korábbi viták fényében.
- Chip- és geopolitikai szál: a Huawei-kompatibilitás hangsúlyozása arra utal, hogy a modell nemcsak szoftvertermék, hanem stratégiai demonstráció is — érdemes figyelni, mennyire lesz ez ténylegesen meghatározó a piaci elterjedésben.
- Etikai és jogi viták: a tiltott chipek használatáról szóló vádak és az Anthropic állítása (Claude „visszaélésszerű” használata) befolyásolhatják a DeepSeek nemzetközi megítélését és partnerségeit.
