Alapok ÚTMUTATÓ

Hármas veszteség és metrikus tanulás

A hármas veszteség arra tanítja a neurális hálózatot, hogy hasonló elemeket közel egymáshoz, a különböző elemeket pedig egymástól távol helyezze el egy beágyazási térben.

Áttekintés

A hármas veszteség arra tanítja a neurális hálózatot, hogy hasonló elemeket közel egymáshoz, a különböző elemeket pedig egymástól távol helyezze el egy beágyazási térben. Ez az alapja az arcfelismerési, képkereső és ajánlási rendszereknek, amelyeknek össze kell hasonlítaniuk a dolgokat, nem pedig csak osztályozniuk.

A hármas veszteség és a metrikus tanulás az AI eszközkészletben található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók.

Mély merülés

A metrikus tanulás modellt képez beágyazások, vektorok létrehozására, ahol a távolság a hasonlóságot tükrözi. A hármas veszteség ezt három bemenet használatával teszi meg egyszerre: egy horgony, egy pozitív (ugyanaz az osztály, mint a horgony), és egy negatív (más osztály). Az objektív legalább egy fix különbséggel közelebb tolja a horgonyt a pozitívhoz, mint a negatívhoz. Formálisan a veszteség max(0, d(a,p) - d(a,n) + margó), ahol d általában euklideszi távolság. A Google 2015-ös FaceNetje népszerűsítette ezt a megközelítést, és közvetlenül megtanulta a 128 dimenziós arcbeágyazást. A betanítás után bármely két elemet összehasonlítja a távolság számítása alapján, nincs szükség átképzésre az új identitásokhoz. Ez a nyílt halmazú képesség az oka annak, hogy a metrikus tanulási képességek ellenőrzési és visszakeresési feladatok osztályozása nem könnyen kezelhető.

Technikai betekintés

Az árrés az, amitől a triplett veszteség működik. Enélkül a modell triviálisan összecsukhatná az összes beágyazást egyetlen pontra, így minden távolság nulla lenne, a sorrend pedig értelmetlenné válna. Az árrés puffert kényszerít: a negatívnak legalább egy árrésszel távolabbnak kell lennie a pozitívnál, mielőtt a veszteség eléri a nullát. A beágyazások általában L2-normalizáltak egy egységhipergömbre, így a távolságok korlátozottak és összehasonlíthatók maradnak. Az árrés (gyakran 0,2 körüli) megválasztása kiegyenlíti, hogy az osztályok milyen szorosan csoportosulnak a köztük lévő szétválás ellen.

A hármas veszteség és a metrikus tanulás elsajátítása

A hármas veszteség arra tanítja a neurális hálózatot, hogy hasonló elemeket közel egymáshoz, a különböző elemeket pedig egymástól távol helyezze el egy beágyazási térben. Ez az alapja az arcfelismerési, képkereső és ajánlási rendszereknek, amelyeknek össze kell hasonlítaniuk a dolgokat, nem pedig csak osztályozniuk. A hármas veszteség és a metrikus tanulás az AI eszközkészletben található. Ha megérti, más AI témák könnyebben értékelhetők és összehasonlíthatók. A mélyebb megértés érdekében kezelje a hármas veszteséget és a metrikus tanulást működési modellként, és ne egyetlen jellemzőként: határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza el, hogy a rendszer mire képes megbízhatóan, és ami még szakértői megítélést igényel.

A gyakorlatban a hármas veszteséget és a metrikus tanulást használó erős csapatok először erős koncepcionális modelleket építenek fel, majd ezeket a modelleket leképezik a valós termelési korlátokhoz. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. Ugyanakkor a különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől.

Segít elkülöníteni a világos technikai állításokat a marketing nyelvezettől. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene.

Feltehet jobb végrehajtási kérdéseket, mielőtt pénzt vagy időt költene. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban.

A közös tudással rendelkező csapatok jobb döntéseket hoznak a termékekkel, irányelvekkel és tanulással kapcsolatban. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A hármasvesztés és a metrikus tanulás jövője

A tiszta triplett veszteséget egyre inkább felváltják a kötegszintű objektívek, mint például a többszörös hasonlóság, a proxy-horgony és a kontrasztos veszteségek (InfoNCE), amelyek lépésenként sok párt hasonlítanak össze, és gyorsabban konvergálnak. Az önfelügyelt módszerek, például a SimCLR azt mutatják, hogy a metrikus tanulás címkék nélkül is működhet, ha a kibővített nézeteket pozitívumként kezelik. Ahogy a vektoros adatbázisok és a visszakereséssel kiegészített generációs hullámzás, a tanult beágyazások támasztják alá a milliárdelemes méretű szemantikai keresést, így a távolság-hasonlóság alapgondolata egyre központibbá válik, még akkor is, amikor a specifikus hármas megfogalmazás elhalványul.

Valós megvalósítás

FaceNet-stílusú arcellenőrzés: a telefonok és az útlevélkapuk megerősítik a személyazonosságot azáltal, hogy ellenőrzik, hogy két arcbeágyazás a távolsági küszöbön belülre esik-e.

Vizuális termékkeresés: az e-kereskedelmi webhelyek lehetővé teszik a vásárlók számára, hogy fényképet töltsenek fel, és a legközelebbi szomszéd beágyazása révén vizuálisan hasonló termékeket keressenek.

Hangszóró ellenőrzése: a hangasszisztensek beágyaznak egy hangmintát, és összehasonlítják egy regisztrált profillal, hogy megerősítsék, ki beszél.

Aláírás- és kézírás-ellenőrzés: a bankok hivatkozásokat ágyaznak be, aláírásokat kérdeznek le, valamint zászlóhamisításokat, ha a távolság meghaladja a betanult határt.

Megvalósítási minták

Hármas veszteség és metrikus tanulás a gyakorlatban

FaceNet-stílusú arcellenőrzés: a telefonok és az útlevélkapuk megerősítik a személyazonosságot azáltal, hogy ellenőrzik, hogy két arcbeágyazás a távolsági küszöbön belülre esik-e.

FaceNet-stílusú arcellenőrzés: a telefonok és az útlevélkapuk megerősítik a személyazonosságot azáltal, hogy ellenőrzik, hogy két arcbeágyazás a távolsági küszöbön belülre esik-e A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs utat tartanak az éles eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Hármas veszteség és metrikus tanulás a gyakorlatban

Vizuális termékkeresés: az e-kereskedelmi webhelyek lehetővé teszik a vásárlók számára, hogy fényképet töltsenek fel, és a legközelebbi szomszéd beágyazása révén vizuálisan hasonló termékeket keressenek.

Vizuális termékkeresés: az e-kereskedelmi webhelyek lehetővé teszik a vásárlók számára, hogy fotókat töltsenek fel, és vizuálisan hasonló tételeket keressenek a legközelebbi szomszéd beágyazásával. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs útvonalat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Hármas veszteség és metrikus tanulás a gyakorlatban

Hangszóró ellenőrzése: a hangasszisztensek beágyaznak egy hangmintát, és összehasonlítják egy regisztrált profillal, hogy megerősítsék, ki beszél.

Hangszóró ellenőrzése: a hangasszisztensek beágyaznak egy hangmintát, és összehasonlítják azt egy regisztrált profillal, hogy megbizonyosodjanak arról, hogy ki beszél. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböt, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Hármas veszteség és metrikus tanulás a gyakorlatban

Aláírás- és kézírás-ellenőrzés: a bankok hivatkozásokat ágyaznak be, aláírásokat kérdeznek le, valamint zászlóhamisításokat, ha a távolság meghaladja a betanult határt.

Aláírás- és kézírás-ellenőrzés: a bankok beágyazzák a hivatkozási és lekérdezési aláírásokat, valamint a zászlóhamisításokat, ha a távolság meghaladja a tanult határt. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, emberi eszkalációs útvonalat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Kockázatok és védőkorlátok

!

A különböző csapatok eltérően használhatják ugyanazt a kifejezést, ezért korán határozza meg a hatókört.

!

A benchmarkok erősnek tűnhetnek, miközben a valós teljesítmény egyenetlen.

!

Az adatminőségi és értékelési tervek figyelmen kívül hagyása gyakran törékeny eredményekhez vezet.

Végrehajtási ütemterv

1

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával.

Kezdje a kívánt eredmény egyszerű nyelvű meghatározásával. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

2

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt.

A tesztelés előtt válasszon egy sikermutatót és egy hibafeltételt. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

3

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel.

Futtasson egy kis pilotot reprezentatív adatokkal, ne egy csiszolt demókészlettel. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

4

Dokumentálja, hol segít a hármas veszteség és a metrikus tanulás, és hol jobbak az egyszerűbb módszerek.

Dokumentálja, hol segít a hármas veszteség és a metrikus tanulás, és hol jobbak az egyszerűbb módszerek. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Folytassa a felfedezést