A modellek tréningje ma még sokszor olyan, mint amikor egy versenyautót hangolsz: nem elég a motor, a pályához és a gumihoz is folyamatosan nyúlnod kell. Az AutoScientist azt ígéri, hogy a „szerelőműhely” egy részét automatizálja — és ezzel gyorsabbá, olcsóbbá teheti a célfeladatokra szabott AI-t.

Mi történt

Az Adaption új terméket jelentett be AutoScientist néven. A célja, hogy a modellek gyorsan megtanuljanak konkrét képességeket egy automatizált, a hagyományos finomhangolásra (fine-tuning) épülő megközelítéssel.

A fine-tuning leegyszerűsítve az, amikor egy általános modellt (amely „mindenből tud egy kicsit”) rászoktatsz egy adott munkára: például egy céges dokumentumstílusra, egy szűk szakterület terminológiájára, vagy egy specifikus feladatmegoldási rutinra. Az AutoScientist különlegessége az ígéret szerint az, hogy nem csak a modell paramétereit „tekergeti”, hanem a tanításhoz használt adatot is együtt optimalizálja — vagyis egyszerre próbálja jobbá tenni a receptet és a szakácsot.

A termék az Adaption korábbi adatplatformjára, az Adaptive Data-ra épít. A logika: ha az adatállomány idővel folyamatosan javul (minőség, lefedettség, relevancia), akkor az AutoScientist ezt a javulást képes lehet „átfordítani” folyamatosan javuló modellekbe is. A cég víziója, hogy a teljes AI-stack alkalmazkodó legyen, és menet közben optimalizáljon arra a feladatra, amit épp meg akarsz oldani.

Miért fontos

A nagy modellek tréningje és finomhangolása ma erősen „laborközpontú” műfaj: drága infrastruktúra, sok iteráció, rengeteg kézi döntés az adatról, a beállításokról és a kiértékelésről. Ha egy rendszer tényleg képes automatizálni a finomhangolás két legfájdalmasabb részét — az adat válogatását/építését és a modellhangolást —, akkor az a hétköznapi felhasználó szintjén is abban csapódhat le, hogy gyorsabban kapsz olyan modellt, ami a te konkrét munkádhoz ért: kevesebb „prompt-bűvészkedéssel”, több kiszámíthatósággal.

Mire figyelj

  1. Mit jelent a „több mint duplázott win rate”? A cég a bevezető anyagokban erős számokat említ, de ezek kontextus nélkül könnyen félreérthetők. Érdemes figyelni, hogy milyen feladatokon, milyen mérési módszerrel és milyen bázishoz képest jön ki a javulás.
  2. Miért nem jók a szokásos benchmarkok? Mivel az AutoScientist feladatspecifikus adaptációra készült, a klasszikus, általános összehasonlítók (mint a SWE-Bench vagy az ARC-AGI) nem feltétlenül mérik azt, amiben erős. Itt az lesz a döntő, hogy valós munkafolyamatokban mennyire hoz stabil nyereséget.
  3. Ki tudja majd valóban használni? Az első 30 nap ingyenessége jó alkalom lehet kipróbálásra, de a lényeg az, hogy milyen eszközláncba illeszthető be (adatforrások, kiértékelés, deploy), és mennyi szakértelmet igényel a „jó” adaptáció reprodukálása.

A TechCrunchnak adott értelmezés szerint az AutoScientist egyik nagy tétje az, hogy a csúcskategóriás tréningek és finomhangolások egy része kiléphessen a legnagyobb laborkörnyezetekből — a gyakorlatban pedig az fog számítani, mennyire tud ezt megbízhatóan és átláthatóan teljesíteni különböző feladatokon.