Anthropic Mythos: elit körben tesztelik a modellt kiberbiztonságra

Az Anthropic előnézetben bemutatta a Mythos nevű „frontier” modelljét, amit több mint 40 partnerrel kiberbiztonsági célokra vet be a Project Glasswing keretében. A cég szerint a modell ezrekben mérhető zero-day sebezhetőséget talált, de a hozzáférés szigorúan korlátozott marad, miközben a háttérben politikai és bizalmi kérdések is feszülnek.

Egy erős AI-modell a kiberbiztonságban egyszerre lehet tűzoltó és gyújtogató eszköz. Az Anthropic most azt ígéri: a Mythos csak „védelmi” célokra kerül kézbe — de a sztori ennél összetettebb.

Mi történt

Az Anthropic kedden előnézetben kiadta új, „frontier” kategóriás modelljét, a Mythos-t. A cég szerint a modellt egy szűk partneri kör használhatja kiberbiztonsági munkára egy új kezdeményezésben, a Project Glasswing-ban.

A programban több mint 40 partner szervezet vesz részt, és a Mythos-t „defensive security work”, vagyis védelmi biztonsági feladatokra vetik be: elsődlegesen szoftverek (saját és nyílt forráskódú rendszerek) átvizsgálására kódszintű sebezhetőségek után. Fontos részlet, hogy az Anthropic állítása szerint a Mythos nem kifejezetten kiberbiztonságra lett betanítva, mégis erre a célra tesztelik.

Az Anthropic azt állítja, hogy a Mythos az elmúlt hetekben „több ezer zero-day” sebezhetőséget azonosított, „sok közülük kritikus”. A cég szerint ezek közül több hiba 1–2 évtizede is létezhetett.

A Mythos az Anthropic Claude-rendszereinek általános célú modellje, amelyről a vállalat azt mondja, hogy erős az agentic coding és a reasoning terén. Közérthetően: az „agentikus” képesség itt azt jelenti, hogy a modell nem csak válaszol egy kérdésre, hanem többlépéses feladatokat is végig tud vinni (gondolj rá úgy, mint egy junior fejlesztőre, aki kap egy feladatlistát, és végigmegy rajta), a „reasoning” pedig a komplexebb következtetési feladatokban való jártasság.

A partnerek között olyan nevek szerepelnek, mint Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft és Palo Alto Networks. A terv szerint a partnerek később megosztják a tapasztalataikat, hogy abból „a tech iparág többi szereplője is profitálhasson”. Ugyanakkor az Anthropic hangsúlyozta: a Mythos előnézete nem lesz általánosan elérhető.

A hír hátterében ott van egy korábbi szivárgás is: a Mythos létezéséről és képességeiről egy, a Fortune által említett adatbiztonsági incidens során derültek ki részletek. Egy vázlatos blogposzt (akkor még „Capybara” néven) nem megfelelően védett dokumentumtárban volt elérhető egy nyilvánosan „inspectálható” adat-tóban (data lake). A szivárgást az Anthropic később „emberi hibának” tulajdonította.

A kiszivárgott anyag szerint a modell egy új szintet képvisel: nagyobb és intelligensebb, mint az addig csúcsnak számító Opus modellek, és „messze a legerősebb” modelljük. Ugyanez a dokumentum azt is felvetette, hogy a modell kiberbiztonsági fenyegetést is jelenthet, ha rosszindulatú szereplők fegyverként használnák hibák keresésére és kihasználására — szemben a mostani, védelmi célú bevetéssel.

Végül, de nem mellékesen: az Anthropic azt is közölte, hogy „folyamatban lévő egyeztetései” vannak szövetségi tisztviselőkkel a Mythos használatáról. A TechCrunch cikke szerint ezt bonyolítja, hogy az Anthropic és a Trump-adminisztráció között jogi vita zajlik, miután a Pentagon a labort ellátási lánc kockázatnak minősítette az Anthropic állítólagos elzárkózása miatt az autonóm célkijelöléstől vagy amerikai állampolgárok megfigyelésétől.

Miért fontos

A Mythos sztorija valójában nem csak arról szól, hogy „jött egy új modell”. Inkább arról, hogy a legfejlettebb AI-k kettős felhasználásúak: ugyanaz a képesség, ami segít megtalálni egy kritikus hibát a kódban, segíthet abban is, hogy valaki gyorsabban exploitot (kihasználó kódot) írjon rá. Az Anthropic ezért választotta a korlátozott hozzáférést és a partneri programot — ez egyfajta „ellenőrzött labor” megközelítés.

A „több ezer zero-day” állítás különösen erős — már csak azért is, mert a zero-day definíció szerint olyan sebezhetőség, amit a gyártó még nem ismer és nincs rá javítás. Ha ezek közül sok tényleg „régi” hiba, az arra utalhat, hogy a szoftver-ökoszisztéma bizonyos rétegeiben évtizedes adósság halmozódott fel: a kód működött, csak közben senki nem nézte elég mélyen, hol reped.

Közben a bizalmi dimenzió sem elhanyagolható. A cikk felidézi, hogy az Anthropic nemrég forráskód-fájlokat is véletlenül kitett, majd a takarítás során GitHub-repók ezreit érintő károkat okozott. Egy olyan cég esetében, amely most „kritikus szoftverek védelméről” beszél, ezek a bakik óhatatlanul ráirányítják a figyelmet arra, mennyire érett a saját biztonsági működésük.

Mire figyelj

Mit tekintenek pontosan „zero-day”-nek a programban? Ha a partnerek később publikálnak módszertant vagy kategorizálást, az sokat számít az állítások értelmezésében.
Lesz-e iparági standard a modell-alapú sebezhetőségvadászatra? A partnerségből származó tanulságokból könnyen lehet best practice — de az is kérdés, mennyire lesz transzparens.
Hogyan kezelik a kettős felhasználás kockázatát? A korlátozott elérés egy lépés, de a „hogyan akadályozzuk meg a fegyveresítést” kérdés hosszabb távon is velünk marad.
Mennyire befolyásolja a politikai-jogi környezet a bevezetést? A szövetségi egyeztetések és a Pentagonhoz kötődő jogi konfliktus a Mythos sorsára és partnerválasztására is hatással lehet.