Véget érhet az olcsó AI-korszak: jön a „token-szorítás”

Az Anthropic szigorítása az OpenClaw-szerű külső AI-eszközöknél nem egyedi eset, hanem egy nagyobb trend jele: a modellek üzemeltetése drága, a befektetők pedig hozamot várnak. A Verge szerint a következő években a pénzügyi nyomás a felhasználóknál is lecsapódhat magasabb árakban, szigorúbb limitekben és új monetizációs trükkökben.

Ha azt érzed, hogy az AI-szolgáltatások hirtelen drágulnak, limitálnak, vagy „okosabban” terelnek fizetős csomagokba, nem képzelődsz: a nagy AI-laboroknál most kezd igazán számítania a matek.

Mi történt

A The Verge beszámolója szerint korábban milliók tapasztalták meg egyik napról a másikra, mit jelent az „AI-pénzszorítás”: az Anthropic jelentősen korlátozta az OpenClaw nevű, virálissá vált AI-ügynökeszköz működését. A lényeg az volt, hogy ha a felhasználók továbbra is a Claude modellt akarták az ügynökeik mögé, akkor „bőkezűen” fizetniük kell érte.

Boris Cherny, a Claude Code vezetője az X-en azt írta: a meglévő előfizetések nem ilyen jellegű, harmadik féltől származó eszközök használati mintáira készültek. A cég „szándékosan” akarja menedzselni a növekedést, hogy hosszú távon fenntarthatóan tudja kiszolgálni az ügyfeleket — és a mostani változás ennek egy lépése.

A cikk ezt a lépést egy szélesebb korszakváltás jelének tekinti. Az elmúlt években a nagy AI-laborok (OpenAI, Anthropic és mások) fokozatosan vezettek be új előfizetési szinteket a „power usereknek”, alakították át a vállalati csomagokat, az OpenAI pedig a platformon belüli hirdetésekkel is kísérletezett. Az Anthropicnál mindehhez most társult a külső eszközök szigorúbb kezelése.

Miért fontos

A háttérben nem csak termékstratégia van, hanem tőke- és költségkényszer. A generatív AI működtetéséhez rengeteg számítási kapacitás (compute) kell — gondolj rá úgy, mint egy óriási, folyamatosan pörgő „villanyórára” a felhőben. A befektetők az elmúlt években százmilliárdokat (a cikk szerint összességében ennél is többet) öntöttek a skálázásba és az adatközpontokba, most pedig elkezdték elvárni a megtérülést.

A The Verge a Gartner elemzőjét, Will Sommert idézi: 2024 és 2029 között a Gartner becslése szerint az AI-adatközpontokba irányuló tőkebefektetés elérheti a 6,3 billió dollárt. Sommer szerint a „jó” megtérüléshez (ROIC — a befektetett tőke megtérülése) nagyjából 25% körüli szint lenne ideális; 12% alatt az intézményi tőke érdeklődése csökken, 7% alatt pedig már leírás-közeli, befektetői szempontból katasztrofális zóna jön.

És itt kapcsolódik be a mindennapi felhasználó pénztárcája: a modellek pénzt jellemzően úgy termelnek, hogy „tokeneket” adnak el. A token az a legkisebb „adag” bemenet, amit a modell feldolgoz — lehet szöveg, kép vagy más adat. A cikk példája alapján angolban nagyjából 4 karakter körül mozog egy token; egy bekezdés kb. 100 token, egy 1500 szavas esszé pedig az OpenAI becslése szerint kb. 2050 token. Minél többet használsz (különösen ügynökökkel, automatizmusokkal, sok futtatással), annál gyorsabban égeted a tokeneket — és annál könnyebb „kilógni” a korábbi, olcsóbb csomagok kereteiből.

Mire figyelj

Árazás és limitek változása a „harmadik fél” eszközeinél: ha egy külső ügynökplatform vagy integráció hirtelen rosszabbul működik, gyakran nem technikai hiba, hanem új korlát vagy árazási szabály.
Új előfizetési szintek és vállalati csomagok átrendezése: a szolgáltatók a nagy fogyasztókat (ügynökök, automatizált munkafolyamatok, csapatok) külön sávokba terelhetik.
Monetizációs kísérletek (pl. hirdetések, csomagok, „fair use” jellegű szabályok): a cikk alapján a bevételi nyomás nő, így többféle pénzcsatorna megjelenése várható.
Token-költség mint új „rezsi”: ha AI-t építesz termékbe vagy munkafolyamatba, érdemes úgy kalkulálni, mintha a token lenne a sávszélesség- vagy felhőköltség megfelelője: skálázásnál nem lineárisan tud fájni.