คู่มือทางเทคนิค

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุล

การสูญเสียโฟกัสเป็นฟังก์ชันการสูญเสียที่ได้รับการดัดแปลงซึ่งจะลดน้ำหนักตัวอย่างง่ายๆ เพื่อให้เครื่องตรวจจับสามารถมุ่งเน้นไปที่ตัวอย่างที่แข็งและหายากได้

ภาพรวม

การสูญเสียโฟกัสเป็นฟังก์ชันการสูญเสียที่ได้รับการดัดแปลงซึ่งจะลดน้ำหนักตัวอย่างง่ายๆ เพื่อให้เครื่องตรวจจับสามารถมุ่งเน้นไปที่ตัวอย่างที่แข็งและหายากได้ ช่วยแก้ไขความไม่สมดุลระหว่างพื้นหลังกับวัตถุที่รุนแรงซึ่งทำให้เครื่องตรวจจับวัตถุในขั้นตอนเดียวพิการ

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

ในการตรวจจับวัตถุ รูปภาพอาจมีวัตถุจริงเพียงไม่กี่ชิ้น แต่มีตำแหน่งที่ต้องการนับหมื่นตำแหน่ง ซึ่งเกือบทั้งหมดเป็นพื้นหลังที่เรียบง่าย ด้วยเอนโทรปีข้ามแบบมาตรฐาน กระแสเชิงลบง่าย ๆ ที่ท่วมท้นนี้ครอบงำการไล่ระดับสีและกลบผลบวกที่หายากออกไป การสูญเสียโฟกัสซึ่งนำมาใช้ในรายงาน RetinaNet ปี 2017 โดย Lin และเพื่อนร่วมงานที่ Facebook AI แก้ไขปัญหานี้ด้วยการคูณ cross-entropy ด้วยปัจจัย (1 - p_t)^gamma เมื่อจำแนกตัวอย่างได้อย่างมั่นใจและถูกต้อง p_t จะเข้าใกล้ 1 ดังนั้นแฟกเตอร์จึงย่อลงจนเหลือศูนย์ และตัวอย่างที่จัดประเภทไว้อย่างดีแทบจะไม่มีประโยชน์เลย ตัวอย่างที่ยากและจัดผิดประเภทจะมีน้ำหนักเกือบเต็ม ด้วยแกมมาประมาณ 2 ทำให้ RetinaNet จับคู่หรือเอาชนะเครื่องตรวจจับแบบสองขั้นตอนที่ช้ากว่า เช่น Faster R-CNN โดยที่ยังคงใช้เครือข่ายแบบ single-pass ที่เรียบง่าย

ข้อมูลเชิงลึกทางเทคนิค

แกมมาพารามิเตอร์การโฟกัสจะควบคุมวิธีการระงับตัวอย่างที่ง่ายดายในเชิงรุก โดยที่การสูญเสียโฟกัสแกมมา 0 จะเท่ากับครอสเอนโทรปีแบบธรรมดา และแกมม่าที่สูงกว่าจะทำให้โฟกัสคมชัดขึ้นบนเคสที่แข็ง อัลฟ่าน้ำหนักสมดุล (มักจะ 0.25 สำหรับคลาสหายาก) มักจะนำมารวมกันด้วย สิ่งสำคัญอย่างยิ่งคือปัจจัยการปรับรูปร่างการไล่ระดับสีใหม่ ไม่ใช่แค่ค่าการสูญเสีย ดังนั้นการขยายพันธุ์กลับจึงเน้นตัวอย่างที่ไม่ชัดเจนโดยธรรมชาติ โดยไม่ต้องขุดฮาร์ดตัวอย่างด้วยตนเองหรือสุ่มตัวอย่างใหม่

การเรียนรู้การสูญเสียโฟกัสเพื่อการตรวจจับที่ไม่สมดุล

การสูญเสียโฟกัสเป็นฟังก์ชันการสูญเสียที่ได้รับการดัดแปลงซึ่งจะลดน้ำหนักตัวอย่างง่ายๆ เพื่อให้เครื่องตรวจจับสามารถมุ่งเน้นไปที่ตัวอย่างที่แข็งและหายากได้ ช่วยแก้ไขความไม่สมดุลระหว่างพื้นหลังกับวัตถุที่รุนแรงซึ่งทำให้เครื่องตรวจจับวัตถุในขั้นตอนเดียวพิการ การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Focal Loss สำหรับ Imbalanced Detection เป็นรูปแบบการทำงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Focal Loss สำหรับการตรวจจับที่ไม่สมดุลจะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุล

การสูญเสียโฟกัสกลายเป็นองค์ประกอบเริ่มต้นที่เหนือกว่า RetinaNet โดยปรากฏในเครื่องตรวจจับเช่น FCOS ในการแบ่งส่วน และในการจำแนกประเภทหางยาว ตัวแปรต่างๆ เช่น การสูญเสียโฟกัสที่มีคุณภาพ การสูญเสียโฟกัสแบบกระจาย และการสูญเสียโฟกัสแบบแปรผัน ได้รับการปรับแต่งสำหรับเครื่องตรวจจับแบบไม่มีจุดยึดและแบบใช้หม้อแปลงสมัยใหม่ เมื่อการตรวจจับเปลี่ยนไปสู่โมเดลการคาดการณ์แบบเซ็ต เช่น DETR ที่ใช้การจับคู่แบบสองฝ่าย การปรับน้ำหนักแบบโฟกัสยังคงเป็นเครื่องมือที่ใช้งานได้จริงไม่ว่าความถี่ของคลาสจะบิดเบือนอย่างรุนแรง

การใช้งานจริงในโลกแห่งความเป็นจริง

การตรวจจับป้ายถนนเล็กๆ หรือคนเดินถนนที่อยู่ห่างไกลในกรอบการขับขี่อัตโนมัติโดยที่พิกเซลส่วนใหญ่เป็นพื้นหลัง

การค้นหาเนื้องอกหรือรอยโรคที่หายากในการสแกนทางการแพทย์ซึ่งมีเนื้อเยื่อที่มีสุขภาพดีครอบงำอยู่

การตรวจจับข้อบกพร่องในสายการผลิตซึ่งชิ้นส่วนที่ได้รับการตรวจสอบส่วนใหญ่เป็นเรื่องปกติ

การระบุเรือขนาดเล็กหรือยานพาหนะในภาพถ่ายดาวเทียมและภาพถ่ายทางอากาศขนาดใหญ่

รูปแบบการดำเนินงาน

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลในทางปฏิบัติ

การตรวจจับป้ายถนนเล็กๆ หรือคนเดินถนนที่อยู่ห่างไกลในกรอบการขับขี่อัตโนมัติโดยที่พิกเซลส่วนใหญ่เป็นพื้นหลัง

การตรวจจับป้ายถนนเล็กๆ หรือคนเดินถนนที่อยู่ห่างไกลในกรอบการขับขี่อัตโนมัติซึ่งพิกเซลส่วนใหญ่เป็นพื้นหลัง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลในทางปฏิบัติ

การค้นหาเนื้องอกหรือรอยโรคที่หายากในการสแกนทางการแพทย์ซึ่งมีเนื้อเยื่อที่มีสุขภาพดีครอบงำอยู่

การค้นหาเนื้องอกหรือรอยโรคที่หายากในการสแกนทางการแพทย์ซึ่งครอบงำโดยเนื้อเยื่อที่มีสุขภาพดี ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลในทางปฏิบัติ

การตรวจจับข้อบกพร่องในสายการผลิตซึ่งชิ้นส่วนที่ได้รับการตรวจสอบส่วนใหญ่เป็นเรื่องปกติ

การระบุข้อบกพร่องในสายการผลิตที่ชิ้นส่วนที่ได้รับการตรวจสอบส่วนใหญ่เป็นชิ้นส่วนปกติ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสูญเสียโฟกัสสำหรับการตรวจจับที่ไม่สมดุลในทางปฏิบัติ

การระบุเรือขนาดเล็กหรือยานพาหนะในภาพถ่ายดาวเทียมและภาพถ่ายทางอากาศขนาดใหญ่

การระบุเรือขนาดเล็กหรือยานพาหนะในภาพถ่ายดาวเทียมและทางอากาศขนาดใหญ่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป