คู่มือ AI แบบเห็นภาพ

CNN ตามภูมิภาค

CNN ตามภูมิภาค (R-CNN) คือกลุ่มเครื่องตรวจจับวัตถุที่เสนอขอบเขตที่เหมาะสมในรูปภาพก่อน จากนั้นใช้ CNN เพื่อจำแนกและจัดวางแต่ละวัตถุอย่างแม่นยำ

ภาพรวม

CNN ตามภูมิภาค (R-CNN) คือกลุ่มเครื่องตรวจจับวัตถุที่เสนอขอบเขตที่เหมาะสมในรูปภาพก่อน จากนั้นใช้ CNN เพื่อจำแนกและจัดวางแต่ละวัตถุอย่างแม่นยำ พวกเขาเปลี่ยนการจัดหมวดหมู่ภาพเป็นการตรวจจับวัตถุเต็มรูปแบบ โดยระบุตำแหน่งและติดป้ายกำกับวัตถุจำนวนมากในคราวเดียว

CNN ตามภูมิภาคอยู่ในเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์

เจาะลึก

การจัดหมวดหมู่รูปภาพตอบว่า 'อะไรอยู่ในภาพนี้' แต่การตรวจจับจะต้องตอบว่า 'ที่ไหน และจำนวนเท่าใด' R-CNN ดั้งเดิม (2014) ใช้อัลกอริธึมภายนอก (การค้นหาแบบเลือก) เพื่อเสนอประมาณ 2,000 ภูมิภาค บิดแต่ละภูมิภาคให้เป็นขนาดคงที่ และใช้ CNN กับทุกภูมิภาค ซึ่งมีความแม่นยำแต่ช้าอย่างเจ็บปวด R-CNN ที่รวดเร็วช่วยเร่งความเร็วนี้ด้วยการรัน CNN หนึ่งครั้งบนอิมเมจทั้งหมดและฟีเจอร์การรวมกลุ่มตามภูมิภาค (การรวม RoI) R-CNN ที่เร็วขึ้นได้เข้ามาแทนที่ Selective Search ด้วย Region Proposal Network (RPN) ที่เรียนรู้แล้ว ทำให้ไปป์ไลน์ทั้งหมดตั้งแต่ต้นทางถึงปลายทางและใกล้เคียงเรียลไทม์ Mask R-CNN ขยายออกไปอีกเพื่อส่งออกมาสก์ระดับพิกเซลสำหรับวัตถุแต่ละชิ้นที่ตรวจพบ

ข้อมูลเชิงลึกทางเทคนิค

การก้าวกระโดดด้านประสิทธิภาพที่สำคัญคือการรวม RoI เข้าด้วยกัน แทนที่จะเรียกใช้ CNN ซ้ำในทุกกล่องที่เสนอ เครือข่ายจะคำนวณแผนผังฟีเจอร์ที่ใช้ร่วมกันสำหรับรูปภาพ จากนั้นครอบตัดและปรับขนาดฟีเจอร์ภายในแต่ละภูมิภาคที่สนใจให้เป็นกริดแบบคงที่ RPN ของ R-CNN เลื่อนไปบนแผนที่ฟีเจอร์นั้นเร็วขึ้นเพื่อทำนายคะแนน 'ความไม่เป็นกลาง' และการปรับกล่องสำหรับกล่องยึดที่กำหนดไว้ล่วงหน้าซึ่งมีขนาดและอัตราส่วนที่แตกต่างกัน สร้างข้อเสนอเกือบฟรี

การเรียนรู้ CNN ตามภูมิภาค

CNN ตามภูมิภาค (R-CNN) คือกลุ่มเครื่องตรวจจับวัตถุที่เสนอขอบเขตที่เหมาะสมในรูปภาพก่อน จากนั้นใช้ CNN เพื่อจำแนกและจัดวางแต่ละวัตถุอย่างแม่นยำ พวกเขาเปลี่ยนการจัดหมวดหมู่ภาพเป็นการตรวจจับวัตถุเต็มรูปแบบ โดยระบุตำแหน่งและติดป้ายกำกับวัตถุจำนวนมากในคราวเดียว CNN ตามภูมิภาคอยู่ในเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า CNN ตามภูมิภาคเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ CNN ตามภูมิภาคจะรักษาสมดุลระหว่างความแม่นยำกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอในการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ CNN ตามภูมิภาค

เครื่องตรวจจับ R-CNN แบบสองขั้นตอนยังคงแข็งแกร่งโดยที่ความแม่นยำเป็นสิ่งสำคัญที่สุด แต่เครื่องตรวจจับแบบขั้นตอนเดียว (YOLO, SSD) และเครื่องตรวจจับที่ใช้หม้อแปลงไฟฟ้า เช่น DETR ซึ่งข้ามจุดยึดและข้อเสนอที่ออกแบบด้วยมือโดยสิ้นเชิง ได้รับความนิยมมากขึ้นในด้านความเร็วและความเรียบง่าย แนวโน้มนี้มุ่งสู่การตรวจจับแบบ end-to-end ไร้จุดยึด และอิงตามการสืบค้น อย่างไรก็ตาม แนวคิดหลักของสายเลือด R-CNN คุณลักษณะที่ใช้ร่วมกัน และการให้เหตุผลระดับภูมิภาค ยังคงมีอิทธิพลต่อระบบการแบ่งส่วน วิดีโอ และระบบตรวจจับ 3 มิติ

การใช้งานจริงในโลกแห่งความเป็นจริง

การตรวจจับและการนับสินค้าบนชั้นวางขายปลีกเพื่อการจัดการสินค้าคงคลัง

การแบ่งส่วนเซลล์หรืออวัยวะในการสแกนทางการแพทย์โดยใช้ Mask R-CNN

การระบุข้อบกพร่องและตำแหน่งในสายการผลิตของโรงงาน

การระบุตำแหน่งยานพาหนะและคนเดินถนนหลายคันในฟีดกล้องขับเคลื่อนอัตโนมัติ

รูปแบบการดำเนินงาน

CNN ตามภูมิภาคในทางปฏิบัติ

การตรวจจับและการนับสินค้าบนชั้นวางขายปลีกเพื่อการจัดการสินค้าคงคลัง

การตรวจจับและการนับผลิตภัณฑ์บนชั้นวางขายปลีกสำหรับทีมการจัดการสินค้าคงคลังมักจะได้รับผลลัพธ์ที่ดีกว่า เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

CNN ตามภูมิภาคในทางปฏิบัติ

การแบ่งส่วนเซลล์หรืออวัยวะในการสแกนทางการแพทย์โดยใช้ Mask R-CNN

การแบ่งส่วนอินสแตนซ์ของเซลล์หรืออวัยวะในการสแกนทางการแพทย์โดยใช้ทีม Mask R-CNN มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

CNN ตามภูมิภาคในทางปฏิบัติ

การระบุข้อบกพร่องและตำแหน่งในสายการผลิตของโรงงาน

การระบุข้อบกพร่องและตำแหน่งในสายการผลิตของโรงงาน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

CNN ตามภูมิภาคในทางปฏิบัติ

การระบุตำแหน่งยานพาหนะและคนเดินถนนหลายคันในฟีดกล้องขับเคลื่อนอัตโนมัติ

การระบุตำแหน่งยานพาหนะและคนเดินถนนหลายคันในฟีดกล้องที่ขับเคลื่อนอัตโนมัติ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน

!

ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม

!

ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น

แผนงานการดำเนินงาน

1

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป