คู่มือพื้นฐาน

Overfitting และ Underfitting

การติดตั้งมากเกินไปคือเมื่อแบบจำลองจดจำข้อมูลการฝึกและล้มเหลวในตัวอย่างใหม่ underfitting คือเมื่อมันง่ายเกินไปที่จะจับภาพรูปแบบที่แท้จริง

ภาพรวม

การติดตั้งมากเกินไปคือเมื่อแบบจำลองจดจำข้อมูลการฝึกและล้มเหลวในตัวอย่างใหม่ underfitting คือเมื่อมันง่ายเกินไปที่จะจับภาพรูปแบบที่แท้จริง การบรรลุเป้าหมายระหว่างกันคือความท้าทายหลักของแมชชีนเลิร์นนิง

Overfitting และ Underfitting อยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น

เจาะลึก

โมเดลทุกรุ่นเหมาะสมกับชุดการฝึกที่มีจำกัด แต่เป้าหมายคือเพื่อให้ทำงานได้ดีกับข้อมูลที่มองไม่เห็น โมเดลโอเวอร์ฟิตจะจัดการกับเสียงรบกวนและลักษณะเฉพาะของชุดการฝึกราวกับว่าเป็นสัญญาณจริง โดยอาจได้คะแนน 99% จากข้อมูลการฝึกแต่กลับลดลงเหลือ 70% ในชุดทดสอบ แบบจำลองด้านล่างเป็นปัญหาตรงกันข้าม เนื่องจากเข้มงวดเกินกว่าจะจับภาพโครงสร้างพื้นฐานได้ ดังนั้นจึงทำได้ไม่ดีทั้งกับข้อมูลการฝึกและการทดสอบ ช่องว่างระหว่างการฝึกซ้อมและการทดสอบเป็นสัญญาณที่ชัดเจน Underfitting แสดงให้เห็นว่ามีข้อผิดพลาดสูงในทุกที่ (อคติสูง) การติดตั้งมากเกินไปจะแสดงว่ามีข้อผิดพลาดในการฝึกต่ำ แต่มีข้อผิดพลาดในการทดสอบสูง (ความแปรปรวนสูง) ทักษะคือการรู้ว่าคุณมีปัญหาใด เนื่องจากการแก้ไขจะดึงไปในทิศทางตรงกันข้าม

ข้อมูลเชิงลึกทางเทคนิค

การติดตั้งมากเกินไปและการลดขนาดลงเป็นปลายทั้งสองด้านของการแลกเปลี่ยนความแปรปรวนอคติ อคติคือข้อผิดพลาดจากการสันนิษฐานที่ง่ายเกินไป ความแปรปรวนคือข้อผิดพลาดจากการไวต่อตัวอย่างการฝึกที่เฉพาะเจาะจงมากเกินไป โมเดลเชิงเส้นขนาดเล็กมีอคติสูงและความแปรปรวนต่ำ (อันเดอร์ฟิต) โมเดลที่ไม่มีข้อจำกัดขนาดใหญ่มีอคติต่ำและความแปรปรวนสูง (เกินพอดี) ข้อผิดพลาดที่คาดหวังทั้งหมดจะสลายไปโดยประมาณเป็นอคติกำลังสองบวกความแปรปรวนบวกสัญญาณรบกวนที่ลดไม่ได้ ผู้ปฏิบัติงานตรวจพบปัญหาโดยการเปรียบเทียบความแม่นยำของชุดการฝึกกับชุดการตรวจสอบความถูกต้องที่ค้างไว้ โดยดูว่าเส้นโค้งทั้งสองแยกออกจากกัน

การเรียนรู้เรื่อง Overfitting และ Underfitting

การติดตั้งมากเกินไปคือเมื่อแบบจำลองจดจำข้อมูลการฝึกและล้มเหลวในตัวอย่างใหม่ underfitting คือเมื่อมันง่ายเกินไปที่จะจับภาพรูปแบบที่แท้จริง การบรรลุเป้าหมายระหว่างกันคือความท้าทายหลักของแมชชีนเลิร์นนิง Overfitting และ Underfitting อยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Overfitting และ Underfitting เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังคงต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Overfitting และ Underfitting จะสร้างโมเดลเชิงแนวคิดที่แข็งแกร่งก่อน จากนั้นจึงจับคู่โมเดลเหล่านั้นกับข้อจำกัดในการผลิตจริง โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในเวลาเดียวกัน ทีมต่างๆ อาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการโอเวอร์ฟิตติ้งและฟิตติ้งอันเดอร์ฟิตติ้ง

แนวคิดเหล่านี้ยังคงเป็นพื้นฐาน แต่โครงข่ายประสาทเทียมขนาดใหญ่มากทำให้ภาพคลาสสิกซับซ้อน โมเดลสมัยใหม่อาจมีพารามิเตอร์มากกว่าจุดข้อมูลมาก แต่ก็ยังสามารถสรุปได้ดี รูปแบบที่น่าแปลกใจซึ่งบางครั้งเรียกว่า 'double descent' ซึ่งข้อผิดพลาดในการทดสอบจะลดลงอีกครั้งหลังจากจุดสูงสุดที่เกินพอดี การวิจัยมุ่งเน้นมากขึ้นเรื่อยๆ ว่าเหตุใดโมเดลที่มีพารามิเตอร์เกินจึงสรุป บทบาทของการทำให้เป็นมาตรฐานโดยนัยในเครื่องมือเพิ่มประสิทธิภาพ และการตรวจจับการเปลี่ยนแปลงการกระจายแบบอัตโนมัติที่ดีขึ้น คาดหวังการวินิจฉัยที่สมบูรณ์ยิ่งขึ้นซึ่งจะแจ้งว่ามีการติดตั้งมากเกินไปในการผลิตเนื่องจากข้อมูลในโลกแห่งความเป็นจริงเบี่ยงเบนไปจากข้อมูลการฝึกอบรม

การใช้งานจริงในโลกแห่งความเป็นจริง

ตัวกรองสแปมที่ติดธงอีเมลทุกฉบับที่มีชื่อผู้ส่งที่เฉพาะเจาะจง เนื่องจากผู้ส่งรายนั้นบังเอิญเจอสแปมอย่างหนักในข้อมูลการฝึกอบรม ทำให้พลาดสแปมเมอร์รายใหม่ไปโดยสิ้นเชิง (มีการติดตั้งมากเกินไป)

โมเดลราคาบ้านที่ใช้พื้นที่เพียงตารางฟุต และไม่สนใจสถานที่ ห้องนอน และสภาพ ดังนั้นจึงพลาดไม่ได้อย่างยิ่งในย่านที่มีราคาแพง (การขาดแคลนอุปกรณ์)

เครื่องแยกประเภทภาพทางการแพทย์ที่เรียนรู้ที่จะตรวจจับลายน้ำจากเครื่องสแกนของโรงพยาบาล แทนที่จะเป็นโรค และล้มเหลวในโรงพยาบาลอื่นๆ (ไม่เหมาะสมกับคุณลักษณะปลอม)

การวางแผนการสูญเสียการฝึกเทียบกับการสูญเสียการตรวจสอบระหว่างการฝึกอบรมและการหยุดเมื่อการสูญเสียการตรวจสอบเริ่มขึ้นในขณะที่การสูญเสียการฝึกยังคงลดลง (จับมากเกินไปตั้งแต่เนิ่นๆ)

รูปแบบการดำเนินงาน

Overfitting และ Underfitting ในทางปฏิบัติ

ตัวกรองสแปมที่ติดธงอีเมลทุกฉบับที่มีชื่อผู้ส่งที่เฉพาะเจาะจง เนื่องจากผู้ส่งรายนั้นบังเอิญเจอสแปมอย่างหนักในข้อมูลการฝึกอบรม ทำให้พลาดสแปมเมอร์รายใหม่ไปโดยสิ้นเชิง (มีการติดตั้งมากเกินไป)

ตัวกรองสแปมที่ทำเครื่องหมายอีเมลทุกฉบับที่มีชื่อผู้ส่งที่เฉพาะเจาะจง เนื่องจากผู้ส่งรายนั้นพบสแปมจำนวนมากในข้อมูลการฝึกอบรม ขาดนักส่งสแปมรายใหม่ไปโดยสิ้นเชิง (มีการติดตั้งมากเกินไป) ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Overfitting และ Underfitting ในทางปฏิบัติ

โมเดลราคาบ้านที่ใช้พื้นที่เพียงตารางฟุต และไม่สนใจสถานที่ ห้องนอน และสภาพ ดังนั้นจึงพลาดไม่ได้อย่างยิ่งในย่านที่มีราคาแพง (การขาดแคลนอุปกรณ์)

แบบจำลองราคาบ้านที่ใช้เพียงพื้นที่เป็นตารางฟุตและไม่สนใจสถานที่ ห้องนอน และสภาพ ดังนั้นจึงพลาดไปอย่างมากในย่านที่มีราคาแพง (อุปกรณ์ไม่เพียงพอ) ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Overfitting และ Underfitting ในทางปฏิบัติ

เครื่องแยกประเภทภาพทางการแพทย์ที่เรียนรู้ที่จะตรวจจับลายน้ำจากเครื่องสแกนของโรงพยาบาล แทนที่จะเป็นโรค และล้มเหลวในโรงพยาบาลอื่นๆ (ไม่เหมาะสมกับคุณลักษณะปลอม)

เครื่องแยกประเภทภาพทางการแพทย์ที่เรียนรู้ที่จะตรวจจับลายน้ำของเครื่องสแกนของโรงพยาบาล แทนที่จะเป็นโรค และล้มเหลวในโรงพยาบาลอื่นๆ (ใช้คุณสมบัติปลอมมากเกินไป) ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Overfitting และ Underfitting ในทางปฏิบัติ

การวางแผนการสูญเสียการฝึกเทียบกับการสูญเสียการตรวจสอบระหว่างการฝึกอบรมและการหยุดเมื่อการสูญเสียการตรวจสอบเริ่มขึ้นในขณะที่การสูญเสียการฝึกยังคงลดลง (จับมากเกินไปตั้งแต่เนิ่นๆ)

การวางแผนการสูญเสียการฝึกอบรมเทียบกับการสูญเสียการตรวจสอบระหว่างการฝึกอบรม และหยุดเมื่อการสูญเสียการตรวจสอบความถูกต้องเริ่มเพิ่มขึ้น ในขณะที่การสูญเสียการฝึกอบรมลดลงเรื่อยๆ (มีการติดตั้งมากเกินไปตั้งแต่เนิ่นๆ) ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

แต่ละทีมอาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ

!

เกณฑ์มาตรฐานอาจดูแข็งแกร่งในขณะที่ประสิทธิภาพในโลกแห่งความเป็นจริงไม่เท่ากัน

!

การเพิกเฉยต่อคุณภาพข้อมูลและแผนการประเมินมักสร้างผลลัพธ์ที่เปราะบาง

แผนงานการดำเนินงาน

1

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เอกสารที่การสวมอุปกรณ์เกินขนาดและอุปกรณ์ส่วนล่างช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า

เอกสารที่การสวมอุปกรณ์เกินขนาดและอุปกรณ์ส่วนล่างช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป