Kiszivárgott az Anthropic „Mythos” modell: miért számít ez biztonsági ügynek?

A Bloomberg szerint egy kis csoport jogosulatlanul hozzáfért az Anthropic Mythos modelljéhez, amelyet a cég kifejezetten veszélyesnek tart „rossz kezekben”. A beszámoló alapján a hozzáférés egy harmadik fél beszállítói környezetén keresztül történhetett, és a csoport két hétig használhatta a rendszert.

Ha egy AI-modellt eleve azért nem engednek nyilvánosan elérhetővé, mert túl könnyen fegyverré válhat, akkor minden jogosulatlan hozzáférés több, mint „egy szivárgás”: biztonsági jelzés a teljes iparágnak.

Mi történt

A Bloomberg értesülései szerint az Anthropic Mythos modelljéhez – amelyet a vállalat saját megfogalmazása szerint veszélyes lehet „rossz kezekben” – egy „kis csoport jogosulatlan felhasználó” hozzáfért. A csoport egyik, névtelenül nyilatkozó tagját a Bloomberg „az Anthropic egyik harmadik féllel szerződött kivitelezőjeként” (third‑party contractor) azonosítja.

A jelentés szerint a hozzáférés több taktika kombinációjával történt: a kivitelező hozzáférését felhasználva és „általánosan használt internetes nyomozó eszközökkel” (internet sleuthing tools). Az Anthropic a Bloombergnek azt nyilatkozta, hogy vizsgálják a jelentést, amely szerint a jogosulatlan hozzáférés „egy harmadik fél beszállítói környezetén” keresztül történt. A cég állítása szerint jelenleg nincs bizonyíték arra, hogy ez hatással lenne az Anthropic rendszereire, vagy túlmutatna a beszállítói környezeten.

A Mythos (pontosabban a Claude Mythos Preview) az Anthropic leírása alapján egy általános célú modell, amely képes sebezhetőségek azonosítására és kihasználására „minden nagyobb operációs rendszerben és minden nagyobb webböngészőben”, ha a felhasználó erre utasítja. (Gondolj rá úgy, mint egy nagyon erős „automata biztonsági szakértőre”: ugyanúgy használható védekezésre, mint támadási ötletek gyorsítására.)

A hivatalos hozzáférést az Anthropic erősen korlátozza: a Project Glasswing kezdeményezésen keresztül néhány nagy cég tesztelheti, a Bloomberg és a The Verge által idézett listában olyan nevek szerepelnek, mint az Nvidia, a Google, az Amazon Web Services, az Apple és a Microsoft. A cikk szerint kormányzati szereplők is érdeklődnek a technológia iránt. Az Anthropicnek a beszámoló alapján jelenleg nincs terve a modell nyilvános kiadására, mert tartanak tőle, hogy fegyverként használható.

A Bloomberg úgy tudja, a jogosulatlan hozzáférés április 7-én történt – ugyanazon a napon, amikor az Anthropic bejelentette, hogy korlátozott körben elérhetővé teszi a Mythost tesztelésre. A csoportot nem nevezték meg, de a Bloomberg szerint egy olyan Discord-csatornához köthető, amely kiadatlan AI-modellekről próbál információt szerezni.

A beszámoló szerint a csoport a Mythos „valószínű” online helyére következtetett: az Anthropic más modelljeinek formátumáról szerzett ismereteket egy friss Mercor-adatszivárgásból felhasználva „megalapozott tippet” adtak a modell elérési pontjára. A Bloomberg állítása szerint a tagok két héten át rendszeresen használták a Mythost, és képernyőképekkel, illetve élő bemutatóval igazolták a hozzáférést. Ugyanakkor – a beszámoló szerint – nem kiberbiztonsági célokra használták, hogy elkerüljék az Anthropic figyelmét. A Bloomberg azt is írja: más, még kiadatlan Anthropic-modellekhez is hozzáférhettek.

Miért fontos

Ez az ügy nem csak arról szól, hogy „valaki belenézett” egy új modellbe. A Mythos jellegéből adódóan – sebezhetőségek megtalálása és kihasználása – a hozzáférés önmagában kockázat, mert egy ilyen eszköz csökkentheti a belépési küszöböt a támadásokhoz. Nem kell hozzá klasszikus értelemben vett elit hacker-tudás, ha a modell jó „tanácsadóként” lépésről lépésre ötleteket ad.

A másik tanulság az ellátási lánc (vendor) oldala. A Bloomberg által leírt forgatókönyvben nem feltétlenül az „anya” rendszer törik fel, hanem egy beszállítói környezeten keresztül nyílik rés. Gondolj rá úgy, mint amikor a főbejárat zárja tökéletes, de a hátsó ajtó kulcsa egy alvállalkozónál van – és valaki ügyesen rájön, hol keresse.

Mire figyelj

Mit erősít meg az Anthropic a vizsgálat után? Kulcskérdés, hogy valóban csak a beszállítói környezet érintett-e, és pontosan milyen hozzáférési szint valósult meg.
Változik-e a Project Glasswing működése? Elképzelhető szigorítás a hozzáférésekben, naplózásban, illetve a tesztkörnyezetek leválasztásában (sandboxing) – ez utóbbi olyan, mint egy elkülönített „homokozó”, ahol a kísérletezés nem ér hozzá a valódi rendszerekhez.
Lesz-e iparági hatása a „kiber-AI” modellek terítésére? A történet könnyen erősítheti azt a trendet, hogy az ilyen képességű modelleket csak szűk körben, erős kontrollok mellett adják ki, és a nyilvános hozzáférést tovább halasztják.