คู่มือ AI แบบเห็นภาพ

การปูรูปภาพ

การจัดวางภาพเป็นศิลปะในการตัดวัตถุออกจากภาพถ่ายด้วยขอบกึ่งโปร่งใสที่สมบูรณ์แบบทุกพิกเซล โดยจับภาพเส้นผมเส้นเล็กทุกเส้นหรือภาพเบลอจากการเคลื่อนไหว

ภาพรวม

การจัดวางภาพเป็นศิลปะในการตัดวัตถุออกจากภาพถ่ายด้วยขอบกึ่งโปร่งใสที่สมบูรณ์แบบทุกพิกเซล โดยจับภาพเส้นผมเส้นเล็กทุกเส้นหรือภาพเบลอจากการเคลื่อนไหว แตกต่างจากการแบ่งส่วนแบบธรรมดาตรงที่จะประมาณจำนวนพิกเซลแต่ละพิกเซลที่อยู่เบื้องหน้า

Image Matting เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์

เจาะลึก

การ Matting จะช่วยแก้สมการคอมโพสิต: แต่ละพิกเซลที่สังเกตได้นั้นเป็นการผสมผสานระหว่างสีพื้นหน้าและสีพื้นหลัง โดยผสมกันด้วยค่าอัลฟ่าระหว่าง 0 ถึง 1 เป้าหมายคือการกู้คืนสีด้านอัลฟ่านั้น ซึ่งเป็นซอฟต์มาสก์โดยที่ 1 อยู่เบื้องหน้าทั้งหมด 0 เป็นพื้นหลังทั้งหมด และค่าเศษส่วนจะจับบริเวณที่คลุมเครือหรือโปร่งแสง นี่เป็นการกำหนดไว้ต่ำกว่าความเป็นจริงทางคณิตศาสตร์ ดังนั้นวิธีการแบบคลาสสิกจึงอาศัยการตัดแต่งแผนที่โดยผู้ใช้เพื่อทำเครื่องหมายเบื้องหน้าที่ชัดเจน พื้นหลังที่แน่นอน และโซนที่ไม่รู้จัก แนวทางการเรียนรู้เชิงลึก เช่น Deep Image Matting (2017) เรียนรู้ที่จะทำนายอัลฟ่าโดยตรงจากรูปภาพและการตัดขอบ ในขณะที่โมเดลใหม่ๆ ที่ไม่มีการตัดแต่งภาพ เช่น MODNet และ Robust Video Matting จะประเมินด้านแบบเรียลไทม์จากฟีดแนวตั้งหรือเว็บแคมเพียงอย่างเดียว

ข้อมูลเชิงลึกทางเทคนิค

โมเดลหลักคือ I = alpha*F + (1 - alpha)*B โดยที่ I คือพิกเซล F และ B เป็นสีพื้นหน้าและพื้นหลัง และอัลฟ่าคือความทึบ ด้วยสิ่งที่รู้สามอย่าง (พิกเซล RGB) และสิ่งที่ไม่รู้จักเจ็ดอย่าง ปัญหาจึงจำเป็นต้องมีผู้รู้ล่วงหน้าหรือคำแนะนำ โครงข่ายประสาทเทียมถดถอยอัลฟาโดยใช้สถาปัตยกรรมตัวเข้ารหัส-ตัวถอดรหัส ซึ่งมักจะมีขั้นตอนการปรับแต่งแยกต่างหากซึ่งจะทำให้ขอบคมชัดขึ้น การสูญเสียจะรวมข้อผิดพลาดในการทำนายอัลฟ่าเข้ากับการสูญเสียองค์ประกอบที่ผสมผสานการทำนายอีกครั้งและเปรียบเทียบกับภาพต้นฉบับ

การเรียนรู้ด้านภาพ

การจัดวางภาพเป็นศิลปะในการตัดวัตถุออกจากภาพถ่ายด้วยขอบกึ่งโปร่งใสที่สมบูรณ์แบบทุกพิกเซล โดยจับภาพเส้นผมเส้นเล็กทุกเส้นหรือภาพเบลอจากการเคลื่อนไหว แตกต่างจากการแบ่งส่วนแบบธรรมดาตรงที่จะประมาณจำนวนพิกเซลแต่ละพิกเซลที่อยู่เบื้องหน้า Image Matting เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Image Matting เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งใช้ Image Matting เพื่อปรับสมดุลความแม่นยำกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอของการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการปูภาพ

Matting กำลังมุ่งสู่การทำงานอัตโนมัติเต็มรูปแบบแบบเรียลไทม์และไม่มีการตัดต่อวิดีโอ ซึ่งช่วยเปลี่ยนพื้นหลังในแฮงเอาท์วิดีโออยู่แล้ว การวิจัยกำลังผลักดันให้มีความละเอียดสูงขึ้น การจัดการกับความโปร่งใสที่ซับซ้อน เช่น แก้วและควันได้ดีขึ้น และการผสานรวมที่แน่นแฟ้นยิ่งขึ้นกับโมเดลที่สร้างขึ้นสำหรับการปรับแสงใหม่และการผสมผสานที่ไร้รอยต่อ คาดว่าการปูจะรวมเข้ากับไปป์ไลน์การแก้ไขตามการแพร่กระจาย ดังนั้นการตัดวัตถุออกและวางลงในฉากใหม่ที่สอดคล้องกับแสงจะกลายเป็นขั้นตอนอัตโนมัติขั้นตอนเดียวบนอุปกรณ์ของผู้บริโภค

การใช้งานจริงในโลกแห่งความเป็นจริง

พื้นหลังเสมือนจริงในการประชุมทางวิดีโอ แทนที่ห้องด้านหลังลำโพงแบบเรียลไทม์

การผสมผสานระหว่างภาพยนตร์และโทรทัศน์กับจอเขียว ดึงนักแสดงที่มีขอบผมที่สะอาดสำหรับ VFX

ภาพถ่ายสินค้าอีคอมเมิร์ซ วางสินค้าบนพื้นหลังสีขาวสะอาดโดยอัตโนมัติ

โหมดแนวตั้งและการสร้างสติกเกอร์ในแอปโทรศัพท์ ช่วยลดผู้คนในการแชร์ผ่านโซเชียล

รูปแบบการดำเนินงาน

Image Matting ในทางปฏิบัติ

พื้นหลังเสมือนจริงในการประชุมทางวิดีโอ แทนที่ห้องด้านหลังลำโพงแบบเรียลไทม์

พื้นหลังเสมือนจริงในการประชุมทางวิดีโอ แทนที่ห้องด้านหลังวิทยากรแบบเรียลไทม์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Image Matting ในทางปฏิบัติ

การผสมผสานระหว่างภาพยนตร์และโทรทัศน์กับจอเขียว ดึงนักแสดงที่มีขอบผมที่สะอาดสำหรับ VFX

การรวมนักแสดงบนจอเขียวของภาพยนตร์และทีวี การแยกนักแสดงที่มีขอบผมสะอาดสำหรับทีม VFX มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Image Matting ในทางปฏิบัติ

รูปภาพสินค้าอีคอมเมิร์ซ วางสินค้าบนพื้นหลังสีขาวสะอาดโดยอัตโนมัติ

ภาพถ่ายผลิตภัณฑ์อีคอมเมิร์ซ การวางรายการบนพื้นหลังสีขาวสะอาดตาโดยอัตโนมัติ ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Image Matting ในทางปฏิบัติ

โหมดแนวตั้งและการสร้างสติกเกอร์ในแอปโทรศัพท์ ช่วยลดผู้คนในการแชร์ผ่านโซเชียล

โหมดแนวตั้งและการสร้างสติกเกอร์ในแอปโทรศัพท์ การตัดผู้คนออกไปแบ่งปันทางสังคม ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน

!

ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม

!

ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น

แผนงานการดำเนินงาน

1

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป