Alapok ÚTMUTATÓ

Önfelügyelt tanulás

Az önfelügyelt tanulás modelleket képez a címkézetlen adatokon egy olyan feladat kitalálásával, amelynek válasza magában az adatban van elrejtve.

Áttekintés

Az önfelügyelt tanulás modelleket képez a címkézetlen adatokon egy olyan feladat kitalálásával, amelynek válasza magában az adatban van elrejtve. Így tanulnak a modern nyelvi és látási alapmodellek a nyers internetről, emberi címkézők hadai nélkül.

A Self-Supervised Learning az alapvető mesterséges intelligencia eszközkészletben található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók.

Mély merülés

Az adatok kézi címkézése lassú és drága, mégis a világ tele van címkézetlen szövegekkel, képekkel, hanggal és videóval. Az önfelügyelt tanulás „ürügyfeladatok” létrehozásával oldja meg a zárolást, ahol az adatok megadják a saját választ. A klasszikus példa a BERT által használt maszkolt nyelvi modellezés: rejtsen el néhány szót a mondatban, és tanítsa meg a modellt, hogy előre jelezze őket a kontextusból. A GPT-stílusú modellek megjósolják a következő szót. A látásban a kontrasztos módszerek, mint például a SimCLR, ugyanazon kép két kibővített kivágását mutatják be a modellnek, és megtanítják neki, hogy ezek összetartoznak, miközben eltolja a különböző képeket. Ezeknek a saját készítésű rejtvényeknek a megoldása arra kényszeríti a modellt, hogy gazdag belső jelentés- és szerkezeti reprezentációkat építsen fel. Ezek a reprezentációk ezután hatékonyan továbbadnak valódi downstream feladatokhoz, kevés vagy semmilyen címkézett adattal.

Technikai betekintés

A trükk az, hogy ingyenesen generál egy felügyeleti jelet. A maszkolt modellezésben a rejtett token a címke, így a veszteség emberi megjegyzés nélkül is kiszámítható. A kontrasztív tanulás során egy kép két kibővítése „pozitív párt” alkot, amelynek szorosan kell elhelyezkednie a beágyazott térben, míg a többi kép „negatívuma” el van tolva. Akárhogy is, a modell a pusztán az adatok saját struktúrájából származó címkékre van optimalizálva, megtanulva az általános jellemzőket, amelyek később csak enyhe finomhangolást igényelnek.

Az önfelügyelt tanulás elsajátítása

A mélyebb megértés kialakítása érdekében az önfelügyelt tanulást működési modellként kezelje, ne egyetlen jellemzőként. Határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza szét azt, amit a rendszer megbízhatóan képes elvégezni, attól, ami még szakértői megítélést igényel.

A gyakorlatban a Self-Supervised Learning rendszert használó erős csapatok először erős koncepcionális modelleket építenek fel, majd ezeket a modelleket valós termelési korlátokhoz igazítják. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. Ugyanakkor a különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Az önfelügyelt tanulás jövője

Az önfelügyelt tanulás a mai alapmodellek motorja, és ez a szerep csak növekedni fog. Az egyértelmű tendencia a multimodális előképzés irányába mutat, ahol egyetlen modell közösen tanul szövegből, képekből, hangból és videóból, önfelügyelt célok segítségével. A kutatók a kontrasztív módszereken túl a maszkos előrejelzési megközelítések felé törekszenek a látásban és az öndesztillációs technikákban, amelyekhez nincs szükség negatív példákra. Ahogy a jó minőségű címkézett adatok szűk keresztmetszetté válnak, az AI méretezésének központi stratégiája továbbra is a hasznos szerkezetek megtanulása közvetlenül a hatalmas, címkézetlen adatfolyamokból marad.

Valós megvalósítás

A BERT megtanulja a nyelvet az elfedett szavak előrejelzésével, majd finomhangolása a kereséshez, a hangulathoz vagy a kérdések megválaszolásához

A SimCLR előtanítja a képkódolót címkézetlen fényképeken, így később nagyon kevés címkével képes osztályozni

A GPT-stílusú modellek úgy tanulnak írni, hogy ismételten megjósolják a következő tokent hatalmas szövegkorpusokon keresztül

A beszédmodellek előképzett nyers, címkézetlen hangra (maszkolt hangszegmensek előrejelzése), mielőtt az átíráshoz igazították volna

Megvalósítási minták

Önfelügyelt tanulás a gyakorlatban

A BERT megtanulja a nyelvet az elfedett szavak előrejelzésével, majd finomhangolja a kereséshez, a hangulathoz vagy a kérdés megválaszolásához.

A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Önfelügyelt tanulás a gyakorlatban

A SimCLR előképzi a képkódolót a címkézetlen fényképeken, így később nagyon kevés címkével képes osztályozni.

Önfelügyelt tanulás a gyakorlatban

A GPT-stílusú modellek úgy tanulnak írni, hogy ismételten megjósolják a következő tokent hatalmas szövegkorpusokon keresztül.

Önfelügyelt tanulás a gyakorlatban

A beszédmodelleket előképzett nyers, címkézetlen hangra (maszkolt hangszegmensek előrejelzésére), mielőtt átírásra adaptálták volna.

Kockázatok és védőkorlátok

A különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört.

A benchmarkok erősnek tűnhetnek, miközben a valós teljesítmény egyenetlen.

Az adatminőségi és értékelési tervek figyelmen kívül hagyása gyakran törékeny eredményekhez vezet.

Végrehajtási ütemterv

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Dokumentálja, hol segít a Self-Supervised Learning, és hol jobbak az egyszerűbb módszerek.

Tekintse ezt bizonyítékkapuként: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.