Mi történt
Az Adaption új terméket jelentett be AutoScientist néven. A célja, hogy a modellek gyorsan megtanuljanak konkrét képességeket egy automatizált, a hagyományos finomhangolásra (fine-tuning) épülő megközelítéssel.A fine-tuning leegyszerűsítve az, amikor egy általános modellt (amely „mindenből tud egy kicsit”) rászoktatsz egy adott munkára: például egy céges dokumentumstílusra, egy szűk szakterület terminológiájára, vagy egy specifikus feladatmegoldási rutinra. Az AutoScientist különlegessége az ígéret szerint az, hogy nem csak a modell paramétereit „tekergeti”, hanem a tanításhoz használt adatot is együtt optimalizálja — vagyis egyszerre próbálja jobbá tenni a receptet és a szakácsot.
A termék az Adaption korábbi adatplatformjára, az Adaptive Data-ra épít. A logika: ha az adatállomány idővel folyamatosan javul (minőség, lefedettség, relevancia), akkor az AutoScientist ezt a javulást képes lehet „átfordítani” folyamatosan javuló modellekbe is. A cég víziója, hogy a teljes AI-stack alkalmazkodó legyen, és menet közben optimalizáljon arra a feladatra, amit épp meg akarsz oldani.
Miért fontos
A nagy modellek tréningje és finomhangolása ma erősen „laborközpontú” műfaj: drága infrastruktúra, sok iteráció, rengeteg kézi döntés az adatról, a beállításokról és a kiértékelésről. Ha egy rendszer tényleg képes automatizálni a finomhangolás két legfájdalmasabb részét — az adat válogatását/építését és a modellhangolást —, akkor az a hétköznapi felhasználó szintjén is abban csapódhat le, hogy gyorsabban kapsz olyan modellt, ami a te konkrét munkádhoz ért: kevesebb „prompt-bűvészkedéssel”, több kiszámíthatósággal.Mire figyelj
- Mit jelent a „több mint duplázott win rate”? A cég a bevezető anyagokban erős számokat említ, de ezek kontextus nélkül könnyen félreérthetők. Érdemes figyelni, hogy milyen feladatokon, milyen mérési módszerrel és milyen bázishoz képest jön ki a javulás.
- Miért nem jók a szokásos benchmarkok? Mivel az AutoScientist feladatspecifikus adaptációra készült, a klasszikus, általános összehasonlítók (mint a SWE-Bench vagy az ARC-AGI) nem feltétlenül mérik azt, amiben erős. Itt az lesz a döntő, hogy valós munkafolyamatokban mennyire hoz stabil nyereséget.
- Ki tudja majd valóban használni? Az első 30 nap ingyenessége jó alkalom lehet kipróbálásra, de a lényeg az, hogy milyen eszközláncba illeszthető be (adatforrások, kiértékelés, deploy), és mennyi szakértelmet igényel a „jó” adaptáció reprodukálása.
A TechCrunchnak adott értelmezés szerint az AutoScientist egyik nagy tétje az, hogy a csúcskategóriás tréningek és finomhangolások egy része kiléphessen a legnagyobb laborkörnyezetekből — a gyakorlatban pedig az fog számítani, mennyire tud ezt megbízhatóan és átláthatóan teljesíteni különböző feladatokon.
