Műszaki ÚTMUTATÓ

Generatív ügynökök és szimulált társadalmak

A generatív ágensek olyan nyelvi modelleken alapuló mesterséges intelligencia-karakterek, amelyek emlékeznek, terveznek és hihető emberekként reagálnak.

Áttekintés

A generatív ágensek olyan nyelvi modelleken alapuló mesterséges intelligencia-karakterek, amelyek emlékeznek, terveznek és hihető emberekként reagálnak. Egy szimulált világba helyezve apró társadalmakat alkotnak, ahol a társadalmi viselkedés magától jön létre.

A Generative Agents and Simulated Societies egy olyan műszaki építőelem, amely nagymértékben befolyásolja a modell minőségét, az infrastruktúra költségeit, a késleltetést és a megbízhatóságot.

Mély merülés

A 2023-as Stanford és Google Smallville nevű projektben a kutatók 25, GPT-3.5 által vezérelt ügynököt helyeztek el egy homokozóvárosba, és figyelték, hogyan viselkednek közösségként. Mindegyik ügynöknek volt egy rövid életrajza, és felébredt, reggelit főzött, dolgozni ment, és a szomszédokkal beszélgetett. Lényeges, hogy a viselkedést nem írták le. Az egyik ügynök úgy döntött, hogy Valentin-napi bulit rendez, és két szimulált napon keresztül a meghívás szájról szájra terjedt, az ügynökök egyeztették az időpontokat, és többen együtt jelentek meg. Az architektúra egyesíti a memóriafolyamot, a visszakeresést, az elmélkedést és a tervezést, így az ügynökök hosszú időn keresztül következetesen járnak el, ahelyett, hogy elfelejtenék a percekkel ezelőtt történteket.

Technikai betekintés

A fő trükk egy memóriafolyam: egy hosszú, időbélyegzett napló mindenről, amit az ügynök megfigyel. A cselekvéshez az ügynök lekéri a releváns emlékeket, amelyeket az aktuális helyzet, a fontosság és az aktuális helyzethez való hasonlóság alapján értékelnek, majd betáplálja őket a nyelvi modell promptjába. Az időszakos reflexiós lépések a nyers emlékeket magasabb szintű betekintésekké foglalják össze (például arra következtetve, hogy valaki szenvedélyesen foglalkozik a kutatással), amelyek visszaraktározódnak, és irányítják a jövőbeli tervezést és párbeszédet.

Generatív ügynökök és szimulált társadalmak elsajátítása

A generatív ágensek olyan nyelvi modelleken alapuló mesterséges intelligencia-karakterek, amelyek emlékeznek, terveznek és hihető emberekként reagálnak. Egy szimulált világba helyezve apró társadalmakat alkotnak, ahol a társadalmi viselkedés magától jön létre. A Generative Agents and Simulated Societies egy olyan műszaki építőelem, amely nagymértékben befolyásolja a modell minőségét, az infrastruktúra költségeit, a késleltetést és a megbízhatóságot. A mély megértés érdekében a generatív ügynököket és a szimulált társadalmakat működési modellként kell kezelni, nem egyetlen jellemzőként: határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza szét azt, amit a rendszer megbízhatóan képes elvégezni, attól, ami még szakértői megítélést igényel.

A gyakorlatban a generatív ügynököket és a szimulált társadalmakat használó erős csapatok optimalizálják az architektúrát, az adatokat és az infrastruktúrát a megbízhatóság és a költségek szempontjából. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

Az építészeti döntések évekig növelik a teljesítményt és a működési költségeket. Ugyanakkor az egyik benchmark optimalizálása elrejtheti a rendszer általános gyengeségeit. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

Az építészeti döntések évekig növelik a teljesítményt és a működési költségeket.

Az építészeti döntések évekig növelik a teljesítményt és a működési költségeket. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A technikai oktatás segít a csapatoknak a megfelelő verem kiválasztásában, nem csak a legújabb készletben.

A technikai oktatás segít a csapatoknak a megfelelő verem kiválasztásában, nem csak a legújabb készletben. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A jobb mérnöki döntések csökkentik a termelés megbízhatósági incidenseit.

A jobb mérnöki döntések csökkentik a termelés megbízhatósági incidenseit. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A generatív ügynökök és a szimulált társadalmak jövője

Várható, hogy a generatív ügynökök gazdagabb, nem játékos karaktereket erősítsenek a játékokban, képzési szimulációkat a tárgyalásokhoz vagy a válságkezeléshez, valamint szintetikus tesztpopulációkat annak tanulmányozásához, hogyan terjednek el a pletykák, az árak vagy az irányelvek a valós megjelenés előtt. A modellek olcsóbbá válásával és a kontextusablak bővülésével a szimulációk több tucattól több ezer ügynökig terjednek. A kutatók társadalomtudományi laboratóriumként is vizsgálják őket, miközben nyitott kérdéseket vetnek fel az elfogultságról, a manipulációról és arról, hogy ezek a játéktársadalmak milyen hűen tükrözik az embereket.

Valós megvalósítás

Stanford Smallville szimulációja, ahol 25 ügynök önállóan szervezett és vett részt egy Valentin-napi partiban

Hihető, memóriavezérelt NPC-k a videojátékokban, amelyek emlékeznek a játékosok múltbeli interakcióira, és haragot vagy barátságot hordoznak

Szintetikus fókuszcsoportok, amelyek különböző vásárlói személyiségeket játszanak a marketingüzenetek vagy termékjellemzők előzetes tesztelése érdekében

Képzési szimulátorok, ahol a mesterséges intelligencia városlakói reagálnak a gyakornok döntéseire katasztrófa-elhárítási vagy diplomáciai gyakorlatok során

Megvalósítási minták

Generatív ágensek és szimulált társadalmak a gyakorlatban

Stanford Smallville szimulációja, ahol 25 ügynök önállóan szervezett és vett részt egy Valentin-napi partiban.

A Stanford-féle Smallville-szimuláció, amelyben 25 ügynök önállóan szervezte meg és vett részt egy Valentin-napi partiban. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs utat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Generatív ágensek és szimulált társadalmak a gyakorlatban

Hihető, memóriavezérelt NPC-k videojátékokban, amelyek emlékeznek a játékosok múltbeli interakcióira, és haragot vagy barátságot hordoznak.

Hihető, memóriavezérelt NPC-k a videojátékokban, amelyek emlékeznek a játékosok múltbeli interakcióira, és haragot vagy barátságot tartanak fenn A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböt, megtartják az emberi eszkalációs utat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Generatív ágensek és szimulált társadalmak a gyakorlatban

Szintetikus fókuszcsoportok, amelyek különböző vásárlói személyiségeket játszanak a marketingüzenetek vagy termékjellemzők előzetes tesztelése érdekében.

Szintetikus fókuszcsoportok, amelyek különböző ügyfélszemélyeket játszanak el a marketingüzenetek vagy termékjellemzők előzetes tesztelése érdekében. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik mind a termelékenységnövekedést, mind a hibaköltségeket az idő múlásával.

Generatív ágensek és szimulált társadalmak a gyakorlatban

Képzési szimulátorok, ahol a mesterséges intelligencia városlakói reagálnak a gyakornok döntéseire katasztrófa-elhárítási vagy diplomáciai gyakorlatok során.

Képzési szimulátorok, ahol a mesterséges intelligencia városlakói reagálnak a gyakornok döntéseire a katasztrófa-elhárítási vagy diplomáciai gyakorlatok során. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs utat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Kockázatok és védőkorlátok

!

Egy benchmark optimalizálása elrejtheti a rendszer általános hiányosságait.

!

Az infrastrukturális és karbantartási költségeket gyakran alábecsülik.

!

A biztonsági és megfigyelhetőségi hiányosságok a rendszerek bonyolultabbá válásával nőhetnek.

Végrehajtási ütemterv

1

A megvalósítás előtt határozza meg a késleltetési, minőségi és költségcélokat.

A megvalósítás előtt határozza meg a késleltetési, minőségi és költségcélokat. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

2

Benchmark reális terhelési és adatviszonyok mellett.

Benchmark reális terhelési és adatviszonyok mellett. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

3

Műszerfigyelés a hibák, az eltolódás és a felhasználói hatások szempontjából.

Műszerfigyelés a hibák, az eltolódás és a felhasználói hatások szempontjából. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

4

A méretezés előtt készítse elő a visszagörgetési és az incidensre adott válaszútvonalakat.

A méretezés előtt készítse elő a visszagörgetési és az incidensre adott válaszútvonalakat. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Folytassa a felfedezést