คู่มือทางเทคนิค

การติดตามวงจรชีวิต MLflow และโมเดล

MLflow เป็นแพลตฟอร์มโอเพ่นซอร์สสำหรับจัดการวงจรการเรียนรู้ของเครื่อง ตั้งแต่การติดตามการทดลองไปจนถึงการสร้างโมเดลบรรจุภัณฑ์และการปรับใช้

ภาพรวม

MLflow เป็นแพลตฟอร์มโอเพ่นซอร์สสำหรับจัดการวงจรการเรียนรู้ของเครื่อง ตั้งแต่การติดตามการทดลองไปจนถึงการสร้างโมเดลบรรจุภัณฑ์และการปรับใช้ เป็นเรื่องสำคัญเพราะมันนำความเป็นระเบียบและความสามารถในการทำซ้ำมาสู่กระบวนการสร้างแบบจำลองที่ยุ่งเหยิงและวนซ้ำ

การติดตามวงจรการใช้งาน MLflow และโมเดลคือองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

MLflow สร้างขึ้นโดย Databricks และเปิดตัวในปี 2018 โดยจัดการกับปัญหาที่พบบ่อย โดยนักวิทยาศาสตร์ด้านข้อมูลทำการทดลองหลายร้อยครั้ง และลืมติดตามว่าพารามิเตอร์ โค้ด และข้อมูลใดที่สร้างแบบจำลองที่ดีที่สุด MLflow จัดระเบียบสิ่งนี้ประมาณสี่องค์ประกอบ การติดตามพารามิเตอร์บันทึก ตัวชี้วัด เวอร์ชันโค้ด และส่วนเอาท์พุตสำหรับทุกการทำงาน เพื่อให้ผลลัพธ์สามารถเปรียบเทียบได้ รหัสแพ็คเกจโปรเจ็กต์ในรูปแบบที่นำมาใช้ซ้ำและทำซ้ำได้พร้อมสภาพแวดล้อมที่กำหนด โมเดลมีรูปแบบมาตรฐานเพื่อให้โมเดลเดียวกันนี้นำไปใช้กับเป้าหมายการแสดงผลจำนวนมากได้ Model Registry เพิ่มการกำหนดเวอร์ชัน การเปลี่ยนขั้นตอน (เช่น การจัดเตรียมเป็นการใช้งานจริง) และเวิร์กโฟลว์การอนุมัติ MLflow เป็นแบบไม่เชื่อเรื่องเฟรมเวิร์ก โดยทำงานร่วมกับ scikit-learn, PyTorch, TensorFlow, XGBoost และอื่นๆ อีกมากมาย ซึ่งเป็นเหตุผลว่าทำไมจึงกลายเป็นมาตรฐานโดยพฤตินัยสำหรับการจัดการการทดลองและ MLOps แบบน้ำหนักเบา

ข้อมูลเชิงลึกทางเทคนิค

การติดตาม MLflow ทำงานผ่าน API การบันทึก: ในสคริปต์การฝึกของคุณ คุณเรียกใช้ฟังก์ชันเพื่อบันทึกพารามิเตอร์ หน่วยวัด และส่วนต่าง ๆ ซึ่งเขียนไปยังเซิร์ฟเวอร์การติดตามที่ได้รับการสนับสนุนจากฐานข้อมูลและที่เก็บส่วนต่าง ๆ การเรียกใช้แต่ละครั้งจะได้รับรหัสที่ไม่ซ้ำกันและเป็นของการทดสอบ รูปแบบโมเดลจะรวมโมเดลที่ได้รับการฝึกด้วยรสชาติ (เฟรมเวิร์ก) บวกกับข้อมูลเมตา ดังนั้นอาร์ติแฟกต์เดียวจึงสามารถโหลดกลับหรือให้บริการผ่าน REST ได้โดยไม่ต้องเขียนโค้ดการอนุมานใหม่

การเรียนรู้ MLflow และการติดตามวงจรชีวิตของโมเดล

MLflow เป็นแพลตฟอร์มโอเพ่นซอร์สสำหรับจัดการวงจรการเรียนรู้ของเครื่อง ตั้งแต่การติดตามการทดลองไปจนถึงการสร้างโมเดลบรรจุภัณฑ์และการปรับใช้ เป็นเรื่องสำคัญเพราะมันนำความเป็นระเบียบและความสามารถในการทำซ้ำมาสู่กระบวนการสร้างแบบจำลองที่ยุ่งเหยิงและวนซ้ำ การติดตามวงจรการใช้งาน MLflow และโมเดลคือองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า MLflow และ Model Lifecycle Tracking เป็นเพียงโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ MLflow และ Model Lifecycle Tracking จะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ MLflow และการติดตามวงจรชีวิตของโมเดล

MLflow กำลังขยายเชิงรุกไปสู่ ​​generative AI โดยเพิ่มการติดตามสำหรับแอปพลิเคชัน LLM การจัดการที่รวดเร็ว และเครื่องมือการประเมินผลสำหรับเครือข่ายและตัวแทน คาดหวังการสนับสนุนที่ลึกยิ่งขึ้นสำหรับการติดตามเอาต์พุต LLM ที่ไม่ได้กำหนดไว้ ชุดข้อมูลและการกำหนดเวอร์ชันพร้อมท์ และการผสานรวมกับสแต็กความสามารถในการสังเกตที่กว้างขึ้น เมื่อการลงทะเบียนเติบโตขึ้น มันก็จะทำหน้าที่เป็นศูนย์กลางการกำกับดูแลที่ทีมต่างๆ อนุมัติ ตรวจสอบ และย้อนกลับทั้งรุ่นคลาสสิกและระบบ generative-AI ทั่วทั้งสภาพแวดล้อมการผลิต

การใช้งานจริงในโลกแห่งความเป็นจริง

ทีมวิทยาศาสตร์ข้อมูลบันทึกทุกการฝึกซ้อมด้วย MLflow Tracking จากนั้นเปรียบเทียบการวิ่งหลายสิบครั้งใน UI เพื่อเลือกโมเดลที่มีประสิทธิภาพดีที่สุด

บริษัทประกันภัยใช้ Model Registry เพื่อส่งเสริมแบบจำลองความเสี่ยงตั้งแต่ขั้นตอนไปจนถึงการใช้งานจริงหลังจากที่ผู้ตรวจสอบอนุมัติการเปลี่ยนแปลงแล้วเท่านั้น

ทีมจัดแพ็คเกจโมเดลในรูปแบบ MLflow หนึ่งครั้ง จากนั้นปรับใช้อาร์ติแฟกต์ที่เหมือนกันกับตำแหน่งข้อมูล REST งานแบทช์ และแพลตฟอร์มระบบคลาวด์

ทีมแอปพลิเคชัน LLM ใช้การติดตาม MLflow เพื่อบันทึกพร้อมท์ การตอบกลับ และเวลาแฝงสำหรับการโทรแต่ละครั้ง เป็นการดีบักเอเจนต์ที่ทำงานผิดปกติ

รูปแบบการดำเนินงาน

การติดตามวงจรชีวิต MLflow และโมเดลในทางปฏิบัติ

ทีมวิทยาศาสตร์ข้อมูลบันทึกทุกการฝึกซ้อมด้วย MLflow Tracking จากนั้นเปรียบเทียบการวิ่งหลายสิบครั้งใน UI เพื่อเลือกโมเดลที่มีประสิทธิภาพดีที่สุด

ทีมวิทยาศาสตร์ข้อมูลบันทึกทุกการฝึกซ้อมด้วยการติดตาม MLflow จากนั้นเปรียบเทียบการวิ่งหลายสิบครั้งใน UI เพื่อเลือกโมเดลที่มีประสิทธิภาพดีที่สุด ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลิตภาพและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การติดตามวงจรชีวิต MLflow และโมเดลในทางปฏิบัติ

บริษัทประกันภัยใช้ Model Registry เพื่อส่งเสริมแบบจำลองความเสี่ยงตั้งแต่ขั้นตอนไปจนถึงการใช้งานจริงหลังจากที่ผู้ตรวจสอบอนุมัติการเปลี่ยนแปลงแล้วเท่านั้น

บริษัทประกันภัยใช้ Model Registry เพื่อส่งเสริมแบบจำลองความเสี่ยงตั้งแต่ขั้นตอนไปจนถึงการใช้งานจริงหลังจากที่ผู้ตรวจสอบอนุมัติการเปลี่ยนผ่านเท่านั้น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การติดตามวงจรชีวิต MLflow และโมเดลในทางปฏิบัติ

ทีมจัดแพ็คเกจโมเดลในรูปแบบ MLflow หนึ่งครั้ง จากนั้นปรับใช้อาร์ติแฟกต์ที่เหมือนกันกับตำแหน่งข้อมูล REST งานแบทช์ และแพลตฟอร์มระบบคลาวด์

ทีมจัดแพ็คเกจโมเดลในรูปแบบ MLflow หนึ่งครั้ง จากนั้นปรับใช้อาร์ติแฟกต์ที่เหมือนกันกับตำแหน่งข้อมูล REST งานแบทช์ และแพลตฟอร์มคลาวด์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การติดตามวงจรชีวิต MLflow และโมเดลในทางปฏิบัติ

ทีมแอปพลิเคชัน LLM ใช้การติดตาม MLflow เพื่อบันทึกพร้อมท์ การตอบกลับ และเวลาแฝงสำหรับการโทรแต่ละครั้ง เป็นการดีบักเอเจนต์ที่ทำงานผิดปกติ

ทีมแอปพลิเคชัน LLM ใช้การติดตาม MLflow เพื่อบันทึกพร้อมท์ การตอบสนอง และเวลาแฝงสำหรับการโทรแต่ละครั้ง การดีบักตัวแทนที่ทำงานผิดปกติ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป