คู่มือทางเทคนิค

เครือข่ายบีบและกระตุ้น

บล็อก Squeeze-and-Excitation (SE) ช่วยให้เครือข่ายแบบหมุนวนเรียนรู้ว่าต้องชั่งน้ำหนักแต่ละช่องสัญญาณมากน้อยเพียงใด และปรับเทียบใหม่ตามบริบททั่วโลก

ภาพรวม

บล็อก Squeeze-and-Excitation (SE) ช่วยให้เครือข่ายแบบหมุนวนเรียนรู้ว่าต้องชั่งน้ำหนักแต่ละช่องสัญญาณมากน้อยเพียงใด และปรับเทียบใหม่ตามบริบททั่วโลก กลไกที่เหมือนดึงดูดความสนใจราคาถูกนี้ชนะการแข่งขัน ImageNet ปี 2017 และกลายเป็นองค์ประกอบมาตรฐานของ CNN

Squeeze-and-Excitation Networks เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

บล็อก SE เปิดตัวโดย Hu, Shen และ Sun ในปี 2560 เพิ่มความน่าสนใจให้กับช่อง CNN อย่างชัดเจน มันทำงานในสองขั้นตอน การ 'บีบ' ใช้การรวมค่าเฉลี่ยทั่วโลกเพื่อยุบแผนผังคุณลักษณะแต่ละรายการ (สูง x กว้าง) ให้เป็นตัวเลขเดียว โดยสร้างคำอธิบายหนึ่งรายการต่อช่องสัญญาณที่สรุปการเปิดใช้งานทั่วโลก 'การกระตุ้น' จะป้อนเวกเตอร์นั้นผ่านเลเยอร์เล็กๆ สองชั้นที่เชื่อมต่อกันอย่างสมบูรณ์โดยมีปัญหาคอขวด (ReLU จากนั้นเป็นซิกมอยด์) เพื่อสร้างน้ำหนักต่อแชนเนลระหว่าง 0 ถึง 1 น้ำหนักเหล่านั้นจะคูณแผนผังคุณลักษณะดั้งเดิม ขยายแชนเนลที่มีประโยชน์และลดค่าที่ไม่เกี่ยวข้อง SENet ชนะการแข่งขัน ILSVRC 2017 โดยลดข้อผิดพลาด 5 อันดับแรกเหลือประมาณ 2.25% บล็อกนี้เพิ่มพารามิเตอร์และการคำนวณพิเศษเพียงไม่กี่เปอร์เซ็นต์ และสล็อตใน ResNet, Inception หรือ MobileNet โดยมีการเปลี่ยนแปลงเพียงเล็กน้อย

ข้อมูลเชิงลึกทางเทคนิค

การบีบจะสร้างเวกเตอร์ความยาว C โดยที่ z_c คือค่าเฉลี่ยเชิงพื้นที่ของช่อง c การคำนวณการกระตุ้น s = sigmoid(W2 * ReLU(W1 * z)) โดยที่ W1 ลดขนาดลงด้วยอัตราส่วนการลด r (โดยทั่วไปคือ 16) และ W2 จะคืนค่า ทำให้ต้นทุนเพิ่มมีขนาดเล็ก เอาต์พุตคือแผนผังคุณลักษณะอินพุตที่ปรับขนาดช่องสัญญาณตาม s มันเป็นรูปแบบหนึ่งของการป้องกันตัวเอง: เครือข่ายจะตัดสินใจจากสถิติทั่วโลกว่าช่องใดมีความสำคัญสำหรับอินพุตเฉพาะนี้

การเรียนรู้เครือข่ายการบีบและกระตุ้น

บล็อก Squeeze-and-Excitation (SE) ช่วยให้เครือข่ายแบบหมุนวนเรียนรู้ว่าต้องชั่งน้ำหนักแต่ละช่องสัญญาณมากน้อยเพียงใด และปรับเทียบใหม่ตามบริบททั่วโลก กลไกที่เหมือนดึงดูดความสนใจราคาถูกนี้ชนะการแข่งขัน ImageNet ปี 2017 และกลายเป็นองค์ประกอบมาตรฐานของ CNN Squeeze-and-Excitation Networks เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Squeeze-and-Excitation Networks เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้เครือข่าย Squeeze-and-Excitation จะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของเครือข่ายบีบและกระตุ้น

บล็อก SE อาศัยอยู่บนสถาปัตยกรรมที่มีประสิทธิภาพภายใน: EfficientNet และ MobileNetV3 ฝังไว้ในบล็อกสำเร็จรูป แนวคิดนี้ก่อให้เกิดกลุ่มโมดูลความสนใจ, CBAM เพิ่มความสนใจเชิงพื้นที่, ECA-Net แทนที่ปัญหาคอขวดด้วยการบิดแบบ 1D ราคาถูก และเทคนิคการปรับเทียบใหม่แบบน้ำหนักเบาเหล่านี้ปรากฏในการตรวจจับ การแบ่งส่วน และแม้แต่ลูกผสมของตัวแปลงการมองเห็น คาดหวังว่าความสนใจของช่องจะยังคงเป็นกลไกที่มีความแม่นยำราคาประหยัดไม่ว่าจะยังคงมีการบิดเบี้ยวอยู่หรือไม่ก็ตาม

การใช้งานจริงในโลกแห่งความเป็นจริง

SENet ชนะการแข่งขัน ImageNet ILSVRC 2017 โดยการเพิ่มบล็อก SE ให้กับแกนหลัก ResNeXt

EfficientNet และ MobileNetV3 ฝังโมดูล SE ไว้ในทุกบล็อกเพื่อเพิ่มความแม่นยำบนอุปกรณ์เคลื่อนที่

ตัวตรวจจับวัตถุและแบบจำลองการแบ่งส่วนจะแทรกบล็อก SE เพื่อเน้นช่องคุณลักษณะที่ให้ข้อมูล

ECA-Net และ CBAM ขยายแนวคิด SE ด้วยการปรับเทียบช่องสัญญาณที่ถูกกว่าหรือการรับรู้เชิงพื้นที่

รูปแบบการดำเนินงาน

เครือข่ายบีบและกระตุ้นในทางปฏิบัติ

SENet ชนะการแข่งขัน ImageNet ILSVRC 2017 โดยการเพิ่มบล็อก SE ให้กับแกนหลัก ResNeXt

SENet ชนะการแข่งขัน ImageNet ILSVRC 2017 โดยการเพิ่มบล็อก SE ลงในแกนหลัก ResNeXt โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

เครือข่ายบีบและกระตุ้นในทางปฏิบัติ

EfficientNet และ MobileNetV3 ฝังโมดูล SE ไว้ในทุกบล็อกเพื่อเพิ่มความแม่นยำบนอุปกรณ์เคลื่อนที่

EfficientNet และ MobileNetV3 ฝังโมดูล SE ไว้ในทุกบล็อกเพื่อเพิ่มความแม่นยำบนอุปกรณ์เคลื่อนที่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

เครือข่ายบีบและกระตุ้นในทางปฏิบัติ

ตัวตรวจจับวัตถุและแบบจำลองการแบ่งส่วนจะแทรกบล็อก SE เพื่อเน้นช่องคุณลักษณะที่ให้ข้อมูล

ตัวตรวจจับวัตถุและแบบจำลองการแบ่งส่วนแทรกบล็อก SE เพื่อเน้นช่องทางคุณลักษณะที่ให้ข้อมูล ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

เครือข่ายบีบและกระตุ้นในทางปฏิบัติ

ECA-Net และ CBAM ขยายแนวคิด SE ด้วยการปรับเทียบช่องสัญญาณที่ถูกกว่าหรือการรับรู้เชิงพื้นที่

ECA-Net และ CBAM ขยายแนวคิด SE ด้วยการปรับเทียบช่องทางที่ถูกกว่าหรือการรับรู้เชิงพื้นที่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป