Tổng quan
BentoML là một khung Python mã nguồn mở đóng gói các mô hình học máy đã được đào tạo thành các đơn vị được chuẩn hóa, có thể triển khai được gọi là 'Bentos'. Nó thu hẹp khoảng cách giữa một mô hình nằm trong sổ ghi chép và một dịch vụ sản xuất thực sự có thể đưa ra các dự đoán qua API.
BentoML và Model Packaging là một khối xây dựng kỹ thuật ảnh hưởng đến chất lượng mô hình, chi phí cơ sở hạ tầng, độ trễ và độ tin cậy trên quy mô lớn.
Lặn sâu
Khi một nhà khoa học dữ liệu hoàn thành việc đào tạo một mô hình, việc đưa nó vào sản xuất thường có nghĩa là viết mã phân phối theo cách thủ công, ghim các phần phụ thuộc, xây dựng hình ảnh Docker và thiết lập API. BentoML tự động hóa việc này. Bạn lưu một mô hình vào kho lưu trữ mô hình cục bộ của nó, sau đó xác định một lớp Dịch vụ có điểm cuối API được trang trí để xử lý suy luận. Lệnh 'bentoml build' đóng gói mô hình, mã Python, các phiên bản phụ thuộc và cấu hình thời gian chạy vào một Bento có phiên bản, độc lập. Từ đó 'bentoml containerize' tạo ra hình ảnh Docker OCI. BentoML hỗ trợ gần như mọi khung (PyTorch, TensorFlow, scikit-learn, XGBoost, Hugging Face Transformers, ONNX) và thêm tính năng phân lô vi mô thích ứng, tự động nhóm các yêu cầu đến để tối đa hóa thông lượng GPU mà không cần thay đổi mã của bạn.
Hiểu biết kỹ thuật
BentoML tách biệt 'Runners' (thực thi mô hình tính toán nặng) khỏi logic máy chủ API. Người chạy có thể mở rộng quy mô độc lập và chạy trong quy trình riêng của họ, trong khi máy chủ HTTP/gRPC nhẹ xử lý việc định tuyến yêu cầu và I/O. Tính năng phân nhóm thích ứng của nó tự động điều chỉnh kích thước lô và khoảng thời gian trễ trong thời gian chạy, do đó, nó hấp thụ các đợt bùng nổ lưu lượng truy cập và khiến các bộ tăng tốc đắt tiền luôn bận rộn. Định dạng Bento được tiêu chuẩn hóa nhúng tệp kê khai, tệp mô hình và môi trường có thể tái tạo, giúp các bản dựng có tính xác định trên các máy.
Nắm vững BentoML và Bao bì mẫu
BentoML là một khung Python mã nguồn mở đóng gói các mô hình học máy đã được đào tạo thành các đơn vị được chuẩn hóa, có thể triển khai được gọi là 'Bentos'. Nó thu hẹp khoảng cách giữa một mô hình nằm trong sổ ghi chép và một dịch vụ sản xuất thực sự có thể đưa ra các dự đoán qua API. BentoML và Model Packaging là một khối xây dựng kỹ thuật ảnh hưởng đến chất lượng mô hình, chi phí cơ sở hạ tầng, độ trễ và độ tin cậy trên quy mô lớn. Để xây dựng sự hiểu biết sâu sắc, hãy coi BentoML và Model Packaging như một mô hình vận hành chứ không phải một tính năng duy nhất: xác định kết quả mong muốn, làm rõ các giả định và tách biệt những gì hệ thống có thể thực hiện một cách đáng tin cậy với những gì vẫn cần đến sự đánh giá của chuyên gia.
Trong thực tế, các nhóm mạnh sử dụng BentoML và Model Packaging sẽ tối ưu hóa các lựa chọn về kiến trúc, dữ liệu và cơ sở hạ tầng theo độ tin cậy và chi phí. Họ ghi lại các tiêu chí thành công rõ ràng, kiểm tra dựa trên dữ liệu và quy trình làm việc thực tế, đồng thời lặp lại dựa trên các kiểu thất bại được quan sát thay vì chiến thắng điểm chuẩn một lần. Đây là nơi sự hiểu biết về mặt lý thuyết biến thành khả năng bền vững trên toàn bộ sản phẩm, chính sách và hoạt động.
Các quyết định về kiến trúc sẽ thúc đẩy hiệu suất và chi phí vận hành trong nhiều năm. Đồng thời, Tối ưu hóa một điểm chuẩn có thể che giấu những điểm yếu lớn hơn của hệ thống. Cách tiếp cận linh hoạt nhất là kết hợp tốc độ thử nghiệm với kỷ luật quản trị: chạy thử nghiệm, thu thập bằng chứng, xuất bản nhật ký quyết định và liên tục cập nhật các biện pháp bảo vệ khi hành vi của mô hình, kỳ vọng của người dùng và các yêu cầu pháp lý phát triển.
Tác động chiến lược
Các quyết định về kiến trúc sẽ thúc đẩy hiệu suất và chi phí vận hành trong nhiều năm.
Các quyết định về kiến trúc sẽ thúc đẩy hiệu suất và chi phí vận hành trong nhiều năm. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Giáo dục kỹ thuật giúp các nhóm chọn nhóm phù hợp chứ không chỉ nhóm mới nhất.
Giáo dục kỹ thuật giúp các nhóm chọn nhóm phù hợp chứ không chỉ nhóm mới nhất. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Lựa chọn kỹ thuật tốt hơn làm giảm sự cố về độ tin cậy trong sản xuất.
Lựa chọn kỹ thuật tốt hơn làm giảm sự cố về độ tin cậy trong sản xuất. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Triển khai trong thế giới thực
Nhóm phát hiện gian lận lưu mô hình XGBoost vào cửa hàng BentoML và xây dựng Bento hiển thị điểm cuối /dự đoán REST để dịch vụ thanh toán gọi trong thời gian thực.
Nhóm nền tảng ML sử dụng 'bentoml containerize' để biến mô hình cảm xúc Ôm mặt thành hình ảnh Docker triển khai đến cụm Kubernetes nội bộ của họ.
Một công ty khởi nghiệp phục vụ mô hình Llama được tinh chỉnh với OpenLLM (được xây dựng trên BentoML), truyền mã thông báo đến giao diện người dùng trò chuyện với tính năng phân nhóm thích ứng giúp giữ cho GPU luôn bão hòa.
Một công ty thị giác máy tính đóng gói bộ phân loại hình ảnh PyTorch với đường dẫn tiền xử lý của nó vào một Bento để các phép biến đổi chính xác được sử dụng trong quá trình đào tạo đi kèm với mô hình.
Các mẫu triển khai
BentoML và Model Packaging trong thực tế
Nhóm phát hiện gian lận lưu mô hình XGBoost vào cửa hàng BentoML và xây dựng Bento hiển thị điểm cuối /dự đoán REST để dịch vụ thanh toán gọi trong thời gian thực.
Nhóm phát hiện gian lận lưu mô hình XGBoost vào cửa hàng BentoML và xây dựng Bento hiển thị điểm cuối /dự đoán REST để dịch vụ thanh toán gọi trong thời gian thực. Các nhóm thường nhận được kết quả tốt hơn khi xác định trước ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí do lỗi theo thời gian.
BentoML và Model Packaging trong thực tế
Nhóm nền tảng ML sử dụng 'bentoml containerize' để biến mô hình cảm xúc Ôm mặt thành hình ảnh Docker triển khai đến cụm Kubernetes nội bộ của họ.
Nhóm nền tảng ML sử dụng 'bentoml containerize' để biến mô hình cảm xúc Ôm mặt thành hình ảnh Docker triển khai đến cụm Kubernetes nội bộ của họ. Các nhóm thường nhận được kết quả tốt hơn khi xác định trước ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp biên và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.
BentoML và Model Packaging trong thực tế
Một công ty khởi nghiệp phục vụ mô hình Llama được tinh chỉnh với OpenLLM (được xây dựng trên BentoML), truyền mã thông báo đến giao diện người dùng trò chuyện với tính năng phân nhóm thích ứng giúp giữ cho GPU luôn bão hòa.
Một công ty khởi nghiệp phục vụ mô hình Llama đã được tinh chỉnh với OpenLLM (được xây dựng trên BentoML), truyền mã thông báo đến giao diện người dùng trò chuyện với tính năng phân nhóm thích ứng giúp duy trì bão hòa GPU Các nhóm thường nhận được kết quả tốt hơn khi họ xác định trước ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.
BentoML và Model Packaging trong thực tế
Một công ty thị giác máy tính đóng gói bộ phân loại hình ảnh PyTorch với đường dẫn tiền xử lý của nó vào một Bento để các phép biến đổi chính xác được sử dụng trong quá trình đào tạo đi kèm với mô hình.
Một công ty thị giác máy tính đóng gói bộ phân loại hình ảnh PyTorch với quy trình tiền xử lý vào một Bento để các phép biến đổi chính xác được sử dụng trong quá trình đào tạo với mô hình. Các Nhóm thường nhận được kết quả tốt hơn khi họ xác định trước ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.
Rủi ro & lan can
Tối ưu hóa một điểm chuẩn có thể che giấu những điểm yếu của hệ thống rộng hơn.
Chi phí cơ sở hạ tầng và bảo trì thường được đánh giá thấp.
Khoảng cách về bảo mật và khả năng quan sát có thể tăng lên khi hệ thống trở nên phức tạp hơn.
Lộ trình thực hiện
Xác định các mục tiêu về độ trễ, chất lượng và chi phí trước khi triển khai.
Xác định các mục tiêu về độ trễ, chất lượng và chi phí trước khi triển khai. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Điểm chuẩn trong điều kiện tải và dữ liệu thực tế.
Điểm chuẩn trong điều kiện tải và dữ liệu thực tế. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Giám sát thiết bị về lỗi, độ lệch và tác động của người dùng.
Giám sát thiết bị về lỗi, độ lệch và tác động của người dùng. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Chuẩn bị đường dẫn khôi phục và ứng phó sự cố trước khi mở rộng quy mô.
Chuẩn bị đường dẫn khôi phục và ứng phó sự cố trước khi mở rộng quy mô. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.