Az AI körüli verseny ma már nem (csak) arról szól, ki ír jobb modellt. Sokkal inkább arról, ki jut chiphez, ki tud elég áramot és hűtést biztosítani, és ki képes valódi, használható adatot gyűjteni — miközben egyesek azt is megkérdőjelezik, hogy a jelenlegi megközelítés alapjai rendben vannak-e.

Mi történt

Egy iparági beszélgetésen öt, az AI „ellátási láncának” különböző pontjain ülő szereplő ugyanarra a következtetésre futott ki: a boom nagyon gyorsan fizikai korlátokba ütközik. A chipgyártás felpörög, de a következő 2–5 évben továbbra is kínálati korlátos lehet a piac — vagyis a legnagyobb felhőszolgáltatók sem biztos, hogy annyi gyorsítót (AI-hoz használt speciális számolóchipet) kapnak, amennyit kifizetnének.

A kereslet közben nem lassul. A felhőpiacon az AI-kapacitás iránti igény akkora, hogy a „backlog” (már lekötött, de még nem teljesített bevétel/kapacitás) egyetlen negyedév alatt hatalmasat ugrott. Ez az a pillanat, amikor a szoftveres ambíciók elkezdenek a hardveres és logisztikai valósággal vitatkozni.

Nem minden szűk keresztmetszet szilícium. A fizikai világban működő AI-nál — önvezetés, drónok, ipari gépek, védelmi rendszerek — a legdrágább erőforrás sokszor az adat, amit nem lehet teljesen „kitalálni” szimulációból. Gondolj rá úgy, mint vezetni tanulni: a szimulátor rengeteget segít, de bizonyos helyzeteket csak az utcán, valódi forgalomban lehet megtapasztalni. A szintetikus (generált) adatok hasznosak, de nem zárják be teljesen a valóság és a modell közti rést.

Miért fontos

A következő AI-ciklus győzteseit nem csak a jobb algoritmusok választják ki, hanem az erőforrásokhoz való hozzáférés: chip, energia, hűtés, adat. Ez átírja a versenyt: előnybe kerülhet, aki vertikálisan integrál (vagyis a teljes „stacket” együtt tervezi — chipet, rendszert, modellt), mert így jobb hatásfokot érhet el. A hatásfok itt nem elvont fogalom: „mennyi hasznos számítást kapsz egy wattból” — ha az áram a plafon, akkor a watt/eredmény arány lesz a valódi skálázási limit.

Mire figyelj

  1. Chipkínálat és szállítási idők: ha a piac évekig kínálati korlátos marad, az az árakat, a felhős kapacitásokat és a modellek kiépítési ütemét is visszafoghatja.
  2. Energia és hűtés mint stratégiai fegyver: az adatközpontok nem csak épületek, hanem erőmű- és hűtésproblémák. Ennek extrém jele, hogy komolyan felmerült az orbitális adatközpont mint opció — csakhogy az űr vákuuma miatt a hőleadás (konvekció nélkül) mérnöki rémálom lehet.
  3. Valós világból jövő adat: a „physical AI” terjedésével az adatgyűjtés lesz a lassító tényező. Aki hozzáfér flottákhoz, szenzorokhoz és terepi működéshez, az tanulási előnybe kerül.
  4. Az alaparchitektúra kérdése: a beszélgetés egyik legérdekesebb mellékszála, hogy nem csak skálázni próbálunk, hanem egyesek szerint lehet, rossz a kiinduló „építészeti terv”. A TechCrunch által idézett szereplők között volt olyan kutató-alapító is, aki kifejezetten a ma bevett AI-alapfeltevéseket akarja megpiszkálni — és ez azért fontos, mert ha igaza van, a következő ugrás nem több GPU-ból, hanem másfajta modellezésből jöhet.