Alapok ÚTMUTATÓ

Folyamatos tanulás és katasztrofális felejtés

A folyamatos tanulás célja, hogy a mesterséges intelligencia egy sor új feladatra oktassa az idő múlásával anélkül, hogy törölné azt, amit már tud.

Áttekintés

A folyamatos tanulás célja, hogy a mesterséges intelligencia egy sor új feladatra oktassa az idő múlásával anélkül, hogy törölné azt, amit már tud. Központi akadálya a katasztrofális felejtés: amikor egy neurális hálózat megtanul egy új feladatot, a gradiensfrissítések felülírják a korábbi feladatokat kódoló súlyokat, és a régi készségek összeomlanak.

A folyamatos tanulás és a katasztrofális felejtés az AI eszköztárában található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók.

Mély merülés

A szabványos neurális hálózatok feltételezik, hogy minden adat egyszerre elérhető. A való világban az adatok egymás után érkeznek, és az új feladatok naiv finomhangolása katasztrofális felejtést okoz – a korábbi feladatok teljesítménye zuhan, mert a megosztott súlyok átírásra kerülnek. A folyamatos tanulás a stabilitás (régi tudás megtartása) és a plaszticitás (új tudás befogadása), a klasszikus stabilitás-plaszticitás dilemma egyensúlyára törekszik. A megoldásoknak három fő családja létezik: a szabályosítási módszerek, mint például az Elastic Weight Consolidation, amelyek büntetik a régi feladatokhoz fontosnak ítélt súlyok megváltoztatását; visszajátszási módszerek, amelyek mintákat tárolnak vagy generálnak múltbeli feladatokból, és beillesztik azokat a képzés során; és olyan architekturális módszerek, amelyek feladatonként új paramétereket vagy modulokat rendelnek hozzá. Egyetlen módszer sem oldja meg teljesen, és az értékelés a feladat-, tartomány- és osztály-növekményes beállításokat öleli fel.

Technikai betekintés

Katasztrofális feledés merül fel, mert az új feladat gradiens süllyedése egy új optimum felé mozgatja a megosztott súlyokat anélkül, hogy a régi feladatokra alkalmas régiók közelében maradnának. Az Elastic Weight Consolidation megbecsüli az egyes súlyok fontosságát (a Fisher információs mátrixon keresztül), és hozzáad egy négyzetes büntetést, amely a fontos súlyokat a régi értékek közelében rögzíti. Az újrajátszás közelíti az eredeti együttes eloszlást a tárolt vagy generált régi példák új kötegekbe keverésével, így a színátmenetek a régi és az új feladatokat egyaránt tükrözik, csökkentve a destruktív felülírást.

A folyamatos tanulás és a katasztrofális felejtés elsajátítása

A folyamatos tanulás célja, hogy a mesterséges intelligencia egy sor új feladatra oktassa az idő múlásával anélkül, hogy törölné azt, amit már tud. Központi akadálya a katasztrofális felejtés: amikor egy neurális hálózat megtanul egy új feladatot, a gradiensfrissítések felülírják a korábbi feladatokat kódoló súlyokat, és a régi készségek összeomlanak. A folyamatos tanulás és a katasztrofális felejtés az AI eszköztárában található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók. A mély megértés kialakítása érdekében a folyamatos tanulást és a katasztrofális felejtést működési modellként kell kezelni, nem egyetlen jellemzőként: határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza szét azt, amit a rendszer megbízhatóan képes elvégezni, attól, ami még szakértői megítélést igényel.

A gyakorlatban a folyamatos tanulást és a katasztrofális felejtést alkalmazó erős csapatok először erős koncepcionális modelleket építenek fel, majd ezeket a modelleket a valós termelési korlátokhoz igazítják. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. Ugyanakkor a különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A folyamatos tanulás és a katasztrofális felejtés jövője

A folyamatos tanulás egyre kritikusabb a nagy modellek naprakészen tartása érdekében teljes, költséges átképzés nélkül. A kutatás a paraméter-hatékony folyamatos frissítések (feladatonként hozzáadott adapterek, LoRA-modulok), a generatív modellek segítségével történő jobb újrajátszás és az alapmodellek ismereteit frissítő módszerek felé törekszik, miközben elkerüli a felejtést és a nem kívánt sodródást. Szorosabb kapcsolatokra számíthat az egész életen át tartó ügynökökhöz, akik az eszközön tanulnak, a magánélet védelmét megőrző újrajátszást, amely elkerüli a nyers adatok tárolását, és a benchmarkokat, amelyek jobban tükrözik a valósághű, nem helyhez kötött adatfolyamokat, nem pedig a letisztult feladathatárokat.

Valós megvalósítás

Egy telepített képosztályozó, amelynek minden hónapban új termékkategóriákat kell megtanulnia, anélkül, hogy elfelejtené a korábbiakat.

Az eszközön belüli személyre szabás (billentyűzet vagy hangasszisztens), amely idővel alkalmazkodik a felhasználóhoz anélkül, hogy elveszítené az általános pontosságot.

Robotok, amelyek egymás után sajátítanak el új manipulációs készségeket, miközben megtartják a korábban elsajátítottakat.

Nyelvi modell frissítése új tényekkel vagy tartományokkal adapterek segítségével, hogy a korábbi képességek megmaradjanak.

Megvalósítási minták

Folyamatos tanulás és katasztrofális felejtés a gyakorlatban

Egy telepített képosztályozó, amelynek minden hónapban új termékkategóriákat kell megtanulnia, anélkül, hogy elfelejtené a korábbiakat.

Egy telepített képosztályozó, amelynek minden hónapban új termékkategóriákat kell megtanulnia, anélkül, hogy elfelejtené a korábbiakat. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Folyamatos tanulás és katasztrofális felejtés a gyakorlatban

Az eszközön belüli személyre szabás (billentyűzet vagy hangasszisztens), amely idővel alkalmazkodik a felhasználóhoz anélkül, hogy elveszítené az általános pontosságot.

Eszközön belüli személyre szabás (billentyűzet vagy hangasszisztens), amely idővel alkalmazkodik a felhasználóhoz anélkül, hogy elveszítené az általános pontosságot. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Folyamatos tanulás és katasztrofális felejtés a gyakorlatban

Robotok, amelyek egymás után sajátítanak el új manipulációs készségeket, miközben megtartják a korábban elsajátítottakat.

Robotok, amelyek egymás után sajátítják el az új manipulációs készségeket, miközben megtartják a korábban elsajátítottakat. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Folyamatos tanulás és katasztrofális felejtés a gyakorlatban

Nyelvi modell frissítése új tényekkel vagy tartományokkal adapterek segítségével, hogy a korábbi képességek megmaradjanak.

Nyelvi modell frissítése új tényekkel vagy tartományokkal adapterek segítségével, hogy megőrizzék a korábbi képességeket. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, emberi eszkalációs útvonalat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Kockázatok és védőkorlátok

!

A különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört.

!

A benchmarkok erősnek tűnhetnek, miközben a valós teljesítmény egyenetlen.

!

Az adatminőségi és értékelési tervek figyelmen kívül hagyása gyakran törékeny eredményekhez vezet.

Végrehajtási ütemterv

1

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával.

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

2

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt.

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

3

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel.

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

4

Dokumentálja, hol segít a folyamatos tanulás és a katasztrofális felejtés, és hol jobbak az egyszerűbb módszerek.

Dokumentálja, hol segít a folyamatos tanulás és a katasztrofális felejtés, és hol jobbak az egyszerűbb módszerek. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Folytassa a felfedezést