คู่มือ AI แบบเห็นภาพ

การประมาณท่าทางของมนุษย์

การประมาณท่าทางของมนุษย์จะตรวจจับตำแหน่งของข้อต่อต่างๆ ของร่างกาย เช่น ข้อศอก เข่า และไหล่ เพื่อสร้างโครงกระดูกดิจิทัลของบุคคลจากรูปภาพหรือวิดีโอ

ภาพรวม

การประมาณท่าทางของมนุษย์จะตรวจจับตำแหน่งของข้อต่อต่างๆ ของร่างกาย เช่น ข้อศอก เข่า และไหล่ เพื่อสร้างโครงกระดูกดิจิทัลของบุคคลจากรูปภาพหรือวิดีโอ โดยจะเปลี่ยนพิกเซลดิบให้เป็นข้อมูลที่มีโครงสร้างเกี่ยวกับการเคลื่อนไหวของผู้คน

การประมาณท่าทางของมนุษย์เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การปฏิบัติงาน และความคิดสร้างสรรค์

เจาะลึก

การประมาณท่าทางจะค้นหาชุดของจุดสำคัญของร่างกาย (โดยทั่วไปคือข้อต่อ 17 ถึง 33 ข้อ) และเชื่อมต่อเข้ากับโครงกระดูก มีกลยุทธ์หลักสองประการ วิธีจากบนลงล่างจะตรวจจับแต่ละคนด้วยกล่องขอบเขต จากนั้นประมาณข้อต่อที่อยู่ภายในกล่องนั้น ถูกต้องแต่ช้าเมื่อมีคนจำนวนมากอยู่ วิธีการจากล่างขึ้นบน เช่น OpenPose จะตรวจจับจุดสำคัญทั้งหมดในภาพพร้อมกัน จากนั้นจึงจัดกลุ่มเป็นรายบุคคล ซึ่งจะขยายขนาดได้ดีกว่าในฝูงชน โมเดลสามารถส่งออกพิกัด 2D หรือยกให้เป็น 3D เครื่องมือยอดนิยม ได้แก่ OpenPose, MoveNet และ MediaPipe ของ Google และ HRNet ซึ่งรักษาคุณสมบัติที่มีความละเอียดสูงไว้เพื่อการแปลร่วมที่แม่นยำ เทคโนโลยีนี้ขับเคลื่อนแอปฟิตเนส การจับการเคลื่อนไหว และการวิเคราะห์กีฬา

ข้อมูลเชิงลึกทางเทคนิค

แทนที่จะถดถอยพิกัดข้อต่อโดยตรง แบบจำลองที่แม่นยำที่สุดทำนายแผนที่ความร้อนต่อข้อต่อ ซึ่งเป็นแผนที่ความน่าจะเป็นที่มีพิกเซลที่สว่างที่สุดทำเครื่องหมายตำแหน่งที่เป็นไปได้ของข้อต่อ ระบบจากล่างขึ้นบนเพิ่ม Part Affinity Field แผนที่เวกเตอร์ที่เข้ารหัสทิศทางของแขนขา ดังนั้นจุดสำคัญที่ตรวจพบจึงสามารถเชื่อมโยงเข้ากับโครงกระดูกที่ถูกต้องได้แม้จะมีคนที่ทับซ้อนกันก็ตาม แกนหลักที่มีความละเอียดสูง เช่น HRNet จะรักษารายละเอียดเชิงพื้นที่อย่างละเอียดทั่วทั้งเครือข่าย ปรับปรุงความแม่นยำสำหรับข้อต่อขนาดเล็กหรือที่มีระยะห่างใกล้เคียงกัน

การเรียนรู้การประมาณท่าทางของมนุษย์

การประมาณท่าทางของมนุษย์จะตรวจจับตำแหน่งของข้อต่อต่างๆ ของร่างกาย เช่น ข้อศอก เข่า และไหล่ เพื่อสร้างโครงกระดูกดิจิทัลของบุคคลจากรูปภาพหรือวิดีโอ โดยจะเปลี่ยนพิกเซลดิบให้เป็นข้อมูลที่มีโครงสร้างเกี่ยวกับการเคลื่อนไหวของผู้คน การประมาณท่าทางของมนุษย์เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การปฏิบัติงาน และความคิดสร้างสรรค์ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Human Pose Estimation เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Human Pose Estimation จะรักษาสมดุลระหว่างความแม่นยำกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอในการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการประมาณค่าท่าทางของมนุษย์

การประมาณท่าทางกำลังเคลื่อนไปสู่ ​​3D แบบเรียลไทม์บนอุปกรณ์ของผู้บริโภค การติดตามบุคคลหลายคนที่มีประสิทธิภาพ และแบบจำลองเต็มร่างกายบวกมือบวกใบหน้าเพื่อการจับภาพการแสดงออกที่สมบูรณ์ยิ่งขึ้น การจับภาพเคลื่อนไหวแบบไม่มีเครื่องหมายกำลังเข้ามาแทนที่ชุดสตูดิโอราคาแพงในภาพยนตร์และชีวกลศาสตร์ คาดหวังการผสมผสานที่แน่นแฟ้นยิ่งขึ้นกับการจดจำการกระทำเพื่อทำความเข้าใจไม่เพียงแต่ท่าทางแต่ยังเป็นกิจกรรม การใช้งานที่เพิ่มขึ้นในการดูแลสุขภาพสำหรับการวิเคราะห์การเดินและการฟื้นฟูสมรรถภาพ และโมเดลบนอุปกรณ์ที่ปกป้องความเป็นส่วนตัวโดยไม่ส่งวิดีโอไปยังคลาวด์

การใช้งานจริงในโลกแห่งความเป็นจริง

แอปฟิตเนสและโยคะที่ตรวจสอบฟอร์มของผู้ใช้และนับจำนวนครั้งจากกล้องในโทรศัพท์

การจับภาพเคลื่อนไหวแบบไม่มีเครื่องหมายสำหรับสร้างภาพเคลื่อนไหวให้กับตัวละครในภาพยนตร์และวิดีโอเกม

การวิเคราะห์กีฬาโดยวัดมุมข้อต่อ การก้าว และเทคนิคของนักกีฬา

การวิเคราะห์กายภาพบำบัดและการเดินติดตามการฟื้นตัวและคุณภาพการเคลื่อนไหวของผู้ป่วย

รูปแบบการดำเนินงาน

การประมาณท่าทางของมนุษย์ในทางปฏิบัติ

แอปฟิตเนสและโยคะที่ตรวจสอบฟอร์มของผู้ใช้และนับจำนวนครั้งจากกล้องในโทรศัพท์

แอปฟิตเนสและโยคะที่ตรวจสอบฟอร์มของผู้ใช้และนับจำนวนซ้ำจากกล้องโทรศัพท์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การประมาณท่าทางของมนุษย์ในทางปฏิบัติ

การจับภาพเคลื่อนไหวแบบไม่มีเครื่องหมายสำหรับสร้างภาพเคลื่อนไหวให้กับตัวละครในภาพยนตร์และวิดีโอเกม

การจับภาพเคลื่อนไหวแบบไม่มีเครื่องหมายสำหรับการสร้างภาพเคลื่อนไหวให้กับตัวละครในภาพยนตร์และวิดีโอเกม ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การประมาณท่าทางของมนุษย์ในทางปฏิบัติ

การวิเคราะห์กีฬาโดยวัดมุมข้อต่อ การก้าว และเทคนิคของนักกีฬา

การวิเคราะห์การกีฬาที่วัดมุมข้อต่อ การก้าว และเทคนิคของนักกีฬา ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การประมาณท่าทางของมนุษย์ในทางปฏิบัติ

การวิเคราะห์กายภาพบำบัดและการเดินติดตามการฟื้นตัวและคุณภาพการเคลื่อนไหวของผู้ป่วย

การวิเคราะห์กายภาพบำบัดและการเดินที่ติดตามการฟื้นตัวและคุณภาพการเคลื่อนไหวของผู้ป่วย ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน

!

ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม

!

ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น

แผนงานการดำเนินงาน

1

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป