Anthropic „ügynökpiaca”: AI-k alkudoztak egymással valódi pénzért

Az Anthropic egy belsős kísérletben apróhirdetéses piacteret épített, ahol AI-ügynökök képviselték a vevőket és az eladókat, és valódi adásvételek születtek. A pilotban 69 munkatárs vett részt, 186 üzlet köttetett több mint 4 000 dollár értékben. A cég szerint a fejlettebb modellek jobb eredményt hoztak, miközben a felhasználók nem feltétlen vették észre a különbséget.

Mi történik, ha nem te alkudozol a piactéren, hanem egy AI-ügynök intézi helyetted? Az Anthropic egy belső „aprón” kipróbálta, és a tanulság nem az, hogy működik-e — hanem hogy kinek működik jobban.

Mi történt

A TechCrunch beszámolója szerint az Anthropic létrehozott egy teszt jellegű apróhirdetéses piacteret, ahol AI-ügynökök képviselték mind a vevőket, mind az eladókat, és valódi termékekre, valódi pénzért kötöttek üzleteket. A kísérlet neve Project Deal volt.

A cég hangsúlyozta, hogy ez csak egy pilot, „önkéntes, önszelekciós” résztvevői körrel: 69 Anthropic-alkalmazott kapott 100 dolláros keretet (ajándékkártyákon), és ebből vásárolhattak a kollégáiktól. Ennek ellenére a vállalat azt írta, hogy meglepte őket, mennyire jól működött a rendszer: 186 üzlet jött létre, összesen több mint 4 000 dollár értékben.

A kísérlet nem egyetlen piactér volt: az Anthropic négy külön „piacot” futtatott különböző modellekkel. Az egyik volt a „valódi” verzió, ahol mindenkit a cég legfejlettebb modellje képviselt, és az üzleteket a teszt után ténylegesen teljesítették. A másik három piac kutatási célokat szolgált.

Fontos megfigyelésük, hogy amikor a felhasználókat fejlettebb modellek képviselték, „objektíven jobb kimeneteleket” értek el. (Gondolj rá úgy, mint egy tárgyalópartnerre: aki jobb érveléssel, jobb információ-összerakással és jobb kompromisszumkereséssel dolgozik, az nagyobb eséllyel alkuszik ki kedvezőbb feltételeket.) A csavar: a felhasználók nem nagyon érzékelték ezt a különbséget, ami felveti az „ügynökminőség-rések” lehetőségét — vagyis azt, hogy aki gyengébb ügynököt kap, nem biztos, hogy észreveszi, hogy rosszabbul jár.

Az Anthropic egy másik, talán meglepő eredményt is megosztott: az ügynököknek adott kezdeti instrukciók látszólag nem befolyásolták sem az eladás valószínűségét, sem a kialkudott árakat.

Miért fontos

Ez a kísérlet kicsi és belső, mégis jól megmutatja, merre tart az „ügynökösített” internet: nem csak chatbotok válaszolnak, hanem helyetted tárgyalnak és tranzaktálnak. Az AI-ügynök itt nem kreatív szövegíró, hanem egy digitális „megbízott”, aki célokat kap (venni/eladni), és a másik oldalon egy másik ügynökkel próbál megállapodni.

A legérzékenyebb tanulság a minőségi különbség: ha a fejlettebb modell tényleg jobb üzletet köt, akkor a piac könnyen kétsebességessé válhat. Nem feltétlen rosszindulatból, hanem egyszerűen azért, mert aki jobb „tárgyaló-ügynököt” engedhet meg magának, az jobb feltételeket ér el — miközben a másik fél ezt akár észre sem veszi. Ez a dinamika a jövőben nem csak apróhirdetéseknél, hanem szolgáltatás-vásárlásnál, előfizetések újratárgyalásánál vagy akár B2B beszerzésnél is megjelenhet.

Az is beszédes, hogy az induló instrukciók nem számítottak sokat. Ez arra utalhat, hogy a tárgyalási eredményeket inkább a modell képességei (érvelés, következetesség, „helyzetfelismerés”) és a piaci környezet határozza meg, nem pedig néhány jól hangzó „légy kemény alkudozó” jellegű beállítás.

Mire figyelj

Ügynökminőség és átláthatóság: ha a felhasználók nem érzékelik, hogy gyengébb ügynököt kaptak, felértékelődik a kérdés: hogyan lehet mérhetően és érthetően jelezni az ügynök képességeit és korlátait.
Egyenlő hozzáférés a „jobb tárgyalóhoz”: ha a fejlettebb modellek objektíven jobb üzletet kötnek, várhatóan megjelennek a „prémium alkudozó” csomagok — és velük együtt a piaci torzulások kockázata.
Valódi pénz, valódi felelősség: amint az ügynökök tranzakciókat kötnek, előkerülnek a vitás helyzetek (félreértés, hibás feltételek, teljesítés). Érdemes figyelni, milyen garanciák és visszavonási mechanizmusok épülnek ezekbe a rendszerekbe.
Instrukciók vs. képességek: ha a kezdeti utasítás kevésbé számít, akkor a „jó prompt” helyett a modellválasztás, a korlátok és a jogosultságok (mit köthet meg, meddig mehet el) lesznek a döntő tényezők.