Aktív tanulási útmutató | AI Understanding

Áttekintés

Az aktív tanulás egy olyan képzési stratégia, ahol a modell maga választja ki, hogy az ember mely címkézetlen példákat jelölje meg legközelebb. Ez azért fontos, mert a címkézési adatok drágák, és az intelligens kiválasztás a megjegyzések töredékével nagy pontosságot érhet el.

Az Active Learning az AI eszközkészletben található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók.

Mély merülés

A legtöbb felügyelt tanulás feltételezi, hogy már van egy nagy halom felcímkézett adat. Az aktív tanulás ezt megfordítja: egy kis címkézett készlettel és egy nagy mennyiségű címkézetlen példával kezdesz, majd ismételten megkérsz egy embert (az „orákulumot”), hogy csak a leginformatívabbakat címkézze meg. A modellt betanítják, a címkézetlen készlet pontozására használják, és a legmagasabb értékű példákat elküldik címkézésre – majd a ciklus megismétlődik. A gyakori kiválasztási stratégiák közé tartozik a bizonytalansági mintavétel (olyan példákat válasszon, amelyekben a modell a legkevésbé biztos), bizottságonkénti lekérdezés (azt válassza ki, ahol az együttes nem ért egyet), és a diverzitási mintavétel (az adatok különböző régióira terjed ki). Ha jól végezzük, az aktív tanulás a teljes adathalmaz pontosságát sokkal kevesebb címke használatával egyezik meg, ezért népszerű az orvosi képalkotásban, az NLP-ben és minden olyan területen, ahol a szakértői megjegyzések lassú vagy költségesek.

Technikai betekintés

Az alapötlet az, hogy megbecsüljük minden címkézetlen pont „értékét”, mielőtt fizetnénk a címkézésért. A bizonytalansági mintavétel a modell saját valószínűségeit használja – például kiválasztja azt a pontot, amelynek felső osztályú valószínűsége a legközelebb van a véletlenhez, vagy a legmagasabb entrópiával vagy a legkisebb különbséggel a felső két osztály között. A bizottságonkénti lekérdezés több modellt képez ki, és kiválasztja azokat a pontokat, amelyekben a leginkább nem értenek egyet. A kulcsfontosságú kockázat a mintavételi torzítás: a bizonytalanság mohó hajszolása egész régiókat figyelmen kívül hagyhat, ezért gyakran kombinálják a sokszínűséget vagy a kötegeltető módszereket.

Az aktív tanulás elsajátítása

A mélyebb megértés érdekében kezelje az aktív tanulást működési modellként, ne egyetlen funkcióként. Határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza szét azt, amit a rendszer megbízhatóan képes elvégezni, attól, ami még szakértői megítélést igényel.

A gyakorlatban az Active Learninget használó erős csapatok először erős koncepcionális modelleket építenek fel, majd ezeket a modelleket valós termelési korlátokhoz igazítják. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. Ugyanakkor a különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Az aktív tanulás jövője

Az aktív tanulást egyre gyakrabban párosítják nagyméretű előképzett és alapozó modellekkel, ahol a cél a minden címkézése helyett az olcsó finomhangolás felé tolódik el néhány nagy értékű példán. Szorosabb integrációra számíthat gyenge felügyelettel, önfelügyelt előképzéssel és humán-in-the-loop eszközökkel, amelyek címkéket javasolnak a lektoroknak, hogy megerősítsék, semmint létrehozzák. Mivel a címkézési költségek dominálnak sok valós telepítésnél, az automatizált kiválasztás és a hatékony annotációs interfészek továbbra is központi szerepet töltenek be a modellek felépítésében olyan speciális, adathiányos területeken, mint az orvostudomány és a jog.

Valós megvalósítás

Egy radiológiai csapat úgy képezi ki a tumordetektort, hogy a modell megjelöli a legkétértelműbb szkenneléseket a szakértő radiológusok számára, hogy megjelöljék, így drámaian lerövidítik az annotálási órákat.

A spam vagy tartalom-moderáló rendszer olyan határüzeneteket jelenít meg, amelyekben a legkevésbé biztos az emberi felülvizsgálók számára, és a leggyorsabban a kemény szélű eseteken fejlődik.

A beszédfelismerő cég olyan hangklipeket választ ki, ahol a modell a legbizonytalanabb (ékezetek, zaj), hogy elküldje átírásra, ahelyett, hogy véletlenszerű klipeket címkézne fel.

Az e-kereskedelmi katalógusok bizottságonkénti lekérdezések segítségével választják ki azokat a termékképeket, amelyeknél több osztályozó nem ért egyet, és előnyben részesíti azokat a kézi kategóriacímkézés során.

Megvalósítási minták

Aktív tanulás a gyakorlatban

Egy radiológiai csapat úgy képezi ki a tumordetektort, hogy a modell megjelöli a legkétértelműbb szkenneléseket a szakértő radiológusok számára, hogy megjelöljék, így drámaian lerövidítik az annotálási órákat.

A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Aktív tanulás a gyakorlatban

A spam vagy tartalom-moderáló rendszer olyan határüzeneteket jelenít meg, amelyekben a legkevésbé biztos az emberi felülvizsgálók számára, és a leggyorsabban a kemény szélű eseteken fejlődik.

A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Aktív tanulás a gyakorlatban

A beszédfelismerő cég olyan hangklipeket választ ki, ahol a modell a legbizonytalanabb (ékezetek, zaj), hogy elküldje átírásra, ahelyett, hogy véletlenszerű klipeket címkézne fel.

A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Aktív tanulás a gyakorlatban

Az e-kereskedelmi katalógusok bizottságonkénti lekérdezések segítségével választják ki azokat a termékképeket, amelyeknél több osztályozó nem ért egyet, és előnyben részesíti azokat a kézi kategóriacímkézés során.

A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Kockázatok és védőkorlátok

!

A különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört.

!

A benchmarkok erősnek tűnhetnek, miközben a valós teljesítmény egyenetlen.

!

Az adatminőségi és értékelési tervek figyelmen kívül hagyása gyakran törékeny eredményekhez vezet.

Végrehajtási ütemterv

1

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

2

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

3

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

4

Dokumentálja, hol segít az aktív tanulás, és hol jobbak az egyszerűbb módszerek.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Folytassa a felfedezést

Mi az az AI?

Ismerje meg az alapvető fogalmakat, mielőtt mélyebbre merül.

Olvassa el az útmutatót

Hogyan tanul az AI

Ismerje meg a modern rendszerek mögötti képzési folyamatot.

Olvassa el az útmutatót

Aktív tanulás

Áttekintés

Mély merülés

Technikai betekintés

Az aktív tanulás elsajátítása

Stratégiai hatás

Az aktív tanulás jövője

Valós megvalósítás

Megvalósítási minták

Aktív tanulás a gyakorlatban

Aktív tanulás a gyakorlatban

Aktív tanulás a gyakorlatban

Aktív tanulás a gyakorlatban

Kockázatok és védőkorlátok

Végrehajtási ütemterv

Folytassa a felfedezést

Mi az az AI?

Hogyan tanul az AI

Related guides