Vállalkozási ÚTMUTATÓ

Modal Labs

A Modal egy szerver nélküli felhőplatform, amely lehetővé teszi a fejlesztők számára, hogy Python-kódot, beleértve a GPU-munkaterheléseket is, a felhőben futtassák úgy, hogy dekorátort adnak egy funkcióhoz.

Áttekintés

A Modal egy szerver nélküli felhőplatform, amely lehetővé teszi a fejlesztők számára, hogy Python-kódot, beleértve a GPU-munkaterheléseket is, a felhőben futtassák úgy, hogy dekorátort adnak egy funkcióhoz. Ez azért fontos, mert eltávolítja a konténerek, az infrastruktúra és a méretezés okozta fájdalmat, így az AI- és adatcsapatok percek alatt telepíthetik a modelleket és a kötegelt feladatokat.

A Modal Labs legjobban a stratégia, a modellelérés, a platformdöntések és az ökoszisztéma-partnerségek összefüggésében érthető.

Mély merülés

A 2021-ben Erik Bernhardsson (a Spotify Annoy könyvtárának és a Luigi megalkotója) és Akshat Bubna által alapított Modal az ML infrastruktúrában a fejlesztői tapasztalatok hiányát célozza meg. A környezetet, a függőségeket és a hardvert közvetlenül a Pythonban határozhatja meg, a Modal pedig konténereket, CPU-kat vagy GPU-kat épít ki, és igény szerint futtatja a kódot, több száz konténerre skálázva, majd visszaállítva nullára. Kiemelkedő funkciója egy egyedi konténer futási környezet és fájlrendszer, amelyet a másodperc alatti hidegindításra terveztek, ami egy hírhedt fájdalompont a kiszolgáló nélküli környezetben. A Modal népszerű a modellkövetkeztetési végpontok, a finomhangolás, a kötegelt feldolgozás, az ütemezett feladatok (cron) és a webes végpontok esetében. A számlázás másodpercenként történik a ténylegesen használt számítás alapján. Koncepcionálisan felveszi a versenyt az AWS Lambdával, a SageMakerrel és a Runpoddal, de kiemeli a kód-első, Pythonic munkafolyamatot.

Technikai betekintés

A Modal legfontosabb mérnöki vívmánya a gyors hidegindítás: egyedi konténervermet és lustán betöltődő fájlrendszert épített fel, így a konténerek percek helyett másodpercek alatt felpöröghetnek, még nagy modellsúlyok mellett is. A fejlesztők kódban írják le a képeket és a GPU-követelményeket; Modális pillanatképeket készít és gyorsítótárazza ezeket, majd automatikusan méretezi a tárolóreplikákat a bejövő terheléshez, és nullára skálázza üresjáratban, így csak a ténylegesen használt számításokért kell fizetnie.

Modal Labs elsajátítása

A Modal egy szerver nélküli felhőplatform, amely lehetővé teszi a fejlesztők számára, hogy Python-kódot, beleértve a GPU-munkaterheléseket is, a felhőben futtassák úgy, hogy dekorátort adnak egy funkcióhoz. Ez azért fontos, mert eltávolítja a konténerek, az infrastruktúra és a méretezés okozta fájdalmat, így az AI- és adatcsapatok percek alatt telepíthetik a modelleket és a kötegelt feladatokat. A Modal Labs legjobban a stratégia, a modellelérés, a platformdöntések és az ökoszisztéma-partnerségek összefüggésében érthető. A mélyebb megértés érdekében kezelje a Modal Labs-ot működési modellként, ne egyetlen funkcióként: határozza meg a kívánt eredményeket, tisztázza a feltételezéseket, és válassza el, hogy a rendszer mit tud megbízhatóan elvégezni, attól, ami még szakértői megítélést igényel.

A gyakorlatban a Modal Labs-t használó erős csapatok értékelik a szállítói stratégiát, az ütemterv megbízhatóságát és a bezárási kockázatot, mielőtt elköteleznék magukat. Dokumentálják az explicit sikerkritériumokat, tesztelik a valósághű adatokat és munkafolyamatokat, és a megfigyelt hibaminták alapján iterálnak, nem pedig egyszeri benchmark győzelmek alapján. Ez az a hely, ahol az elméleti megértés tartós képességgé válik a termék, a politika és a műveletek között.

A szállítói ütemterv befolyásolja, hogy csapata milyen funkciókat építhet fel legközelebb. Ugyanakkor a Launch bejelentések meghaladhatják a valódi termelési munkafolyamatok stabilitását. A legrugalmasabb megközelítés a kísérleti sebesség és az irányítási fegyelem kombinálása: kísérleti kísérletek futtatása, bizonyítékok rögzítése, döntési naplók közzététele és a biztosítékok folyamatos frissítése a modell viselkedésének, a felhasználói elvárásoknak és a szabályozási követelményeknek megfelelően.

Stratégiai hatás

A szállítói ütemterv befolyásolja, hogy csapata milyen funkciókat építhet fel legközelebb.

A szállítói ütemterv befolyásolja, hogy csapata milyen funkciókat építhet fel legközelebb. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A kereskedelmi feltételek és a telepítési lehetőségek befolyásolják a hosszú távú költségeket és kockázatokat.

A kereskedelmi feltételek és a telepítési lehetőségek befolyásolják a hosszú távú költségeket és kockázatokat. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A vállalati ösztönzők alakítják a termék alapértelmezett beállításait, a biztonsági testtartást és a nyitottságot.

A vállalati ösztönzők alakítják a termék alapértelmezett beállításait, a biztonsági testtartást és a nyitottságot. A kiváló minőségű telepítéseknél ez mérhető működési szabályokká, tulajdonosi határokká és ismétlődő felülvizsgálati rituálékká alakul át, így a csapatok növelhetik a bizalmat a kétértelműség skálázása helyett.

A Modal Labs jövője

Ahogy a mesterséges intelligencia a kísérletezésről a termelésre tér át, a súrlódásmentes telepítés iránti igény nő. A Modal várhatóan elmélyíti az elosztott képzés, az ügynöki és hosszú távú munkaterhelések támogatását, az AI-ügynökök sandbox-kódvégrehajtását és a gazdagabb megfigyelhetőséget. A tét az, hogy a győztes ML platform a fejlesztői sebességre optimalizál, így a kis csapatok GPU-val támogatott szolgáltatásokat szállíthatnak dedikált infrastruktúra-csapat nélkül.

Valós megvalósítás

A fejlesztő a képgeneráló funkciót egy modális dekorátorral burkolja, és azonnal kap egy automatikus skálázó GPU által támogatott webes végpontot.

Egy adatcsapat éjszakai kötegelt munkát végez több ezer fájlon a Modal cron ütemezésének és a kifutó párhuzamosságnak a használatával.

Egy mesterséges intelligencia indítása finomhangolja a nyitott modellt a modális GPU-kon, másodpercenként fizet, és a munka végeztével nullára skálázza.

Az ügynökplatformok modális sandboxokat használnak a nem megbízható, mesterséges intelligencia által generált kód biztonságos futtatására elszigetelt tárolókban.

Megvalósítási minták

Modal Labs a gyakorlatban

A fejlesztő a képgeneráló funkciót egy modális dekorátorral burkolja, és azonnal kap egy automatikus skálázó GPU által támogatott webes végpontot.

A fejlesztő a képgeneráló funkciót egy modális dekorátorral burkolja, és azonnal megkapja az automatikus skálázó, GPU által támogatott webes végpontot. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöbértékeket, megtartják az emberi eszkalációs útvonalat az éles esetekben, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Modal Labs a gyakorlatban

Egy adatcsapat éjszakai kötegelt munkát végez több ezer fájlon a Modal cron ütemezésének és a kifutó párhuzamosságnak a használatával.

Egy adatcsapat éjszakai kötegelt feladatot futtat több ezer fájlon a Modal cron ütemezése és a kifutó párhuzamosság használatával. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, emberi eszkalációs útvonalat tartanak a szélsőséges esetekben, és nyomon követik a termelékenység növekedését és a hibaköltségeket az idő múlásával.

Modal Labs a gyakorlatban

Egy mesterséges intelligencia indítása finomhangolja a nyitott modellt a modális GPU-kon, másodpercenként fizet, és a munka végeztével nullára skálázza.

Egy mesterséges intelligencia indítása finomhangolja a nyitott modellt a modális GPU-kon, másodpercenként fizet, és a munka végeztével nullára skálázódik. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, megtartják az emberi eszkalációs útvonalat a szélsőséges eseteknél, és nyomon követik a termelékenységnövekedést és a hibaköltségeket az idő múlásával.

Modal Labs a gyakorlatban

Az ügynökplatformok modális sandboxokat használnak a nem megbízható, mesterséges intelligencia által generált kód biztonságos futtatására elszigetelt tárolókban.

Az ügynökplatformok modális sandboxokat használnak a nem megbízható, mesterséges intelligencia által generált kód biztonságos futtatására elszigetelt tárolókban. A csapatok általában jobb eredményeket érnek el, ha előre meghatározzák a minőségi küszöböket, emberi eszkalációs útvonalat tartanak a szélsőséges eseteknél, és nyomon követik a termelékenység növekedését és a hibaköltségeket is.

Kockázatok és védőkorlátok

!

Az indítási bejelentések meghaladhatják a valódi termelési munkafolyamatok stabilitását.

!

Az API-árazás vagy az irányelvváltások egyik napról a másikra megdönthetik a feltételezéseket.

!

Az egyszállítótól való függőség növeli a bezárási és migrációs költségeket.

Végrehajtási ütemterv

1

Értékelje a szolgáltatókat saját feladatai és adatkészletei segítségével.

Értékelje a szolgáltatókat saját feladatai és adatkészletei segítségével. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

2

Az integráció előtt tekintse át az adatvédelmi, biztonsági és jogi feltételeket.

Az integráció előtt tekintse át az adatvédelmi, biztonsági és jogi feltételeket. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

3

Tartsa fenn a tartalék tervet a modellek vagy szállítók között.

Tartsa fenn a tartalék tervet a modellek vagy szállítók között. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

4

Figyelje a kiadási megjegyzéseket, hogy az ütemterv változásai ne lepjék meg a csapatokat.

Figyelje a kiadási megjegyzéseket, hogy az ütemterv változásai ne lepjék meg a csapatokat. Minden lépést bizonyítékkapuként kell kezelni: ha a feltételek nem teljesülnek, szüneteltesse a közzétételt, zárja be a rést, és csak ezután bővítse a felhasználást.

Folytassa a felfedezést