Фирми РЪКОВОДСТВО

Модални лаборатории

Modal е безсървърна облачна платформа, която позволява на разработчиците да изпълняват код на Python, включително работни натоварвания на GPU, в облака чрез добавяне на декоратор към функция.

Преглед

Modal е безсървърна облачна платформа, която позволява на разработчиците да изпълняват код на Python, включително работни натоварвания на GPU, в облака чрез добавяне на декоратор към функция. Има значение, защото премахва болката от контейнерите, инфраструктурата и мащабирането, така че AI и екипите за данни могат да разгръщат модели и пакетни задания за минути.

Modal Labs се разбира най-добре в контекста на стратегия, достъп до модели, решения за платформа и партньорства в екосистемите.

Дълбоко гмуркане

Основана през 2021 г. от Ерик Бернхардсон (създател на библиотеката Annoy на Spotify и Луиджи) и Акшат Бубна, Modal е насочена към пропуските между разработчиците и опита в ML инфраструктурата. Вие дефинирате вашата среда, зависимости и хардуер директно в Python, а Modal изгражда контейнери, предоставя CPU или GPU и изпълнява вашия код при поискване, мащабирайки се до стотици контейнери и обратно до нула. Неговата забележителна характеристика е персонализирано време за изпълнение на контейнер и файлова система, проектирана за под-секундни студени стартове, прословута болезнена точка при без сървър. Modal е популярен за крайни точки за извеждане на модели, фина настройка, групова обработка, планирани задания (cron) и уеб крайни точки. Таксуването е на секунда за действително използваните изчисления. Той се конкурира концептуално с AWS Lambda, SageMaker и Runpod, но набляга на първо кодиране, Pythonic работен процес.

Техническа информация

Ключовото инженерно постижение на Modal е бързият студен старт: той изгради персонализиран стек от контейнери и файлова система с отложено зареждане, така че контейнерите да могат да се завъртят за секунди, а не за минути, дори при големи тегла на модела. Разработчиците описват изображенията и изискванията за GPU в код; Модалните моментни снимки и ги кешират, след което автоматично мащабират репликите на контейнери, за да съответстват на входящото натоварване и мащабират до нула, когато са неактивни, така че плащате само за действително използваните изчисления.

Овладяване на Modal Labs

Modal е безсървърна облачна платформа, която позволява на разработчиците да изпълняват код на Python, включително работни натоварвания на GPU, в облака чрез добавяне на декоратор към функция. Има значение, защото премахва болката от контейнерите, инфраструктурата и мащабирането, така че AI и екипите за данни могат да разгръщат модели и пакетни задания за минути. Modal Labs се разбира най-добре в контекста на стратегия, достъп до модели, решения за платформа и партньорства в екосистемите. За да изградите дълбоко разбиране, третирайте Modal Labs като оперативен модел, а не като отделна функция: дефинирайте желаните резултати, изяснете предположенията и отделете това, което системата може да направи надеждно, от това, което все още изисква експертна преценка.

На практика силните екипи, използващи Modal Labs, оценяват стратегията на доставчика, надеждността на пътната карта и риска от блокиране, преди да се ангажират. Те документират изрични критерии за успех, тестват срещу реалистични данни и работни потоци и повтарят въз основа на наблюдавани модели на неуспех, а не на еднократни победи в бенчмарка. Това е мястото, където теоретичното разбиране се превръща в трайна способност за продукти, политики и операции.

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък. В същото време съобщенията за стартиране може да изпреварят стабилността в реалните производствени работни процеси. Най-устойчивият подход е да се комбинира скоростта на експериментиране с дисциплината на управление: стартирайте пилотни проекти, събирайте доказателства, публикувайте регистрационни файлове за решения и непрекъснато актуализирайте предпазните мерки, докато поведението на модела, очакванията на потребителите и регулаторните изисквания се развиват.

Стратегическо въздействие

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък.

Пътните карти на доставчиците влияят на това какви функции вашият екип може да изгради по-нататък. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Търговските условия и опциите за внедряване влияят върху дългосрочните разходи и риск.

Търговските условия и опциите за внедряване влияят върху дългосрочните разходи и риск. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Стимулите на компанията оформят продуктовите стандарти, безопасността и откритостта.

Стимулите на компанията оформят продуктовите стандарти, безопасността и откритостта. При висококачествени внедрявания това се превръща в измерими правила за работа, граници на собствеността и повтарящи се ритуали за преглед, така че екипите да могат да мащабират доверието, вместо да мащабират неяснотата.

Бъдещето на Modal Labs

Тъй като AI преминава от експериментиране към производство, търсенето на внедряване без триене нараства. Очаквайте Modal да задълбочи поддръжката за разпределено обучение, агентни и дълготрайни работни натоварвания, изпълнение на код в пясъчна среда за AI агенти и по-богата наблюдаемост. Залогът е, че печелившата ML платформа оптимизира скоростта на разработчиците, позволявайки на малки екипи да доставят услуги, поддържани от GPU, без специален инфраструктурен екип.

Внедряване в реалния свят

Разработчикът обвива функция за генериране на изображения с модален декоратор и незабавно получава автоматично мащабираща се уеб крайна точка, поддържана от GPU.

Екип за данни изпълнява нощна групова работа на хиляди файлове, използвайки cron графика на Modal и разклонения паралелизъм.

Стартиране на AI прецизира отворен модел на модални графични процесори, като плаща на секунда и мащабира до нула, когато работата приключи.

Платформа на агент използва Modal sandboxes за безопасно изпълнение на ненадежден, генериран от AI код в изолирани контейнери.

Модели на изпълнение

Modal Labs на практика

Разработчикът обвива функция за генериране на изображения с модален декоратор и незабавно получава автоматично мащабираща се уеб крайна точка, поддържана от GPU.

Разработчикът обгръща функция за генериране на изображение с модален декоратор и незабавно получава автоматично мащабираща се GPU-подкрепена уеб крайна точка. Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество отпред, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Modal Labs на практика

Екип за данни изпълнява нощна групова работа на хиляди файлове, използвайки cron графика на Modal и разклонения паралелизъм.

Екип за данни изпълнява нощна групова работа на хиляди файлове, използвайки графика на cron на Modal и разклонения паралелизъм. Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Modal Labs на практика

Стартиране на AI прецизира отворен модел на модални графични процесори, като плаща на секунда и мащабира до нула, когато работата приключи.

Стартираща компания с изкуствен интелект настройва фино отворен модел на модални графични процесори, като плаща за секунда и мащабира до нула, когато работата приключи Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат път на човешка ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Modal Labs на практика

Платформа на агент използва Modal sandboxes за безопасно изпълнение на ненадежден, генериран от AI код в изолирани контейнери.

Платформа на агент използва Modal sandboxes за безопасно изпълнение на ненадежден, генериран от AI код в изолирани контейнери. Екипите обикновено получават по-добри резултати, когато дефинират прагове за качество предварително, поддържат човешки път за ескалация за крайни случаи и проследяват както печалбите в производителността, така и разходите за грешки във времето.

Рискове и предпазни огради

!

Съобщенията за стартиране може да изпреварят стабилността в реалните производствени работни процеси.

!

Ценообразуването на API или промените в политиката могат да разбият предположенията за една нощ.

!

Зависимостта от един доставчик увеличава разходите за заключване и миграция.

Пътна карта за изпълнение

1

Оценявайте доставчиците, като използвате вашите собствени задачи и набори от данни.

Оценявайте доставчиците, като използвате вашите собствени задачи и набори от данни. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

2

Прегледайте поверителността, сигурността и правните условия преди интегриране.

Прегледайте поверителността, сигурността и правните условия преди интегриране. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

3

Поддържайте резервен план за модели или доставчици.

Поддържайте резервен план за модели или доставчици. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

4

Наблюдавайте бележките по изданието, така че промените в пътната карта да не изненадват екипите.

Наблюдавайте бележките по изданието, така че промените в пътната карта да не изненадват екипите. Отнасяйте се към всяка стъпка като към вход за доказателства: ако критериите не са изпълнени, поставете на пауза разпространението, запълнете празнината и едва след това разширете използването.

Продължете да изследвате