คู่มือ AI แบบเห็นภาพ

โฟโตแกรมเมทรี

โฟโตแกรมเมทรีเปลี่ยนภาพถ่ายที่ทับซ้อนกันธรรมดาๆ ให้กลายเป็นโมเดล 3 มิติ แผนที่ และการวัดที่แม่นยำ

ภาพรวม

โฟโตแกรมเมทรีเปลี่ยนภาพถ่ายที่ทับซ้อนกันธรรมดาๆ ให้กลายเป็นโมเดล 3 มิติ แผนที่ และการวัดที่แม่นยำ สิ่งสำคัญคือช่วยให้ทุกคนสร้างเรขาคณิตในโลกแห่งความเป็นจริงขึ้นใหม่ได้ในวงกว้างโดยใช้เพียงกล้อง ตั้งแต่การสำรวจด้วยโดรนไปจนถึงการแปลงสิ่งประดิษฐ์ในพิพิธภัณฑ์ให้เป็นดิจิทัล

Photogrammetry เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์

เจาะลึก

Photogrammetry กู้คืนโครงสร้าง 3 มิติโดยการวิเคราะห์ว่าจุดฉากเดียวกันปรากฏขึ้นอย่างไรในภาพถ่าย 2 มิติที่ทับซ้อนกันจำนวนมากที่ถ่ายจากมุมที่แตกต่างกัน ไปป์ไลน์จะตรวจจับคุณสมบัติที่โดดเด่นก่อน (โดยใช้ตัวตรวจจับเช่น SIFT) จากนั้นจึงจับคู่คุณสมบัติเหล่านั้นระหว่างรูปภาพ โครงสร้างจากการเคลื่อนไหว (SfM) ร่วมกันแก้ไขตำแหน่งและการวางแนวของกล้องทุกตัว บวกกับคลาวด์แบบกระจายของจุด 3D ปรับแต่งทุกอย่างด้วยการปรับแบบกลุ่ม การเพิ่มประสิทธิภาพสี่เหลี่ยมจัตุรัสน้อยที่สุดขนาดยักษ์ จากนั้น Multi-View Stereo (MVS) จะหนาแน่นขึ้นเป็นหลายล้านจุดซึ่งมีการซ้อนกันและมีพื้นผิว เนื่องจากได้มาจากเรขาคณิตเมตริกจากจินตภาพ โฟโตแกรมเมทรีจึงสนับสนุนการทำแผนที่ การสำรวจ การอนุรักษ์มรดกทางวัฒนธรรม เอฟเฟกต์ภาพ และการสร้างเนื้อหาของเกม ซึ่งมักจะบรรลุความแม่นยำระดับต่ำกว่าเซนติเมตรด้วยกล้องที่ปรับเทียบแล้วและจุดควบคุมภาคพื้นดิน

ข้อมูลเชิงลึกทางเทคนิค

แกนหลักทางคณิตศาสตร์คือสภาวะคอลลิเนียร์ริตี้ โดยจุด 3 มิติ จุดศูนย์กลางออปติคัลของกล้อง และการฉายภาพบนระนาบภาพจะอยู่บนรังสีเส้นเดียว เมื่อมีรังสีซ้อนทับกันมากพอ สามเหลี่ยมจะปักหมุดพิกัด 3 มิติลง การปรับแบบกลุ่มช่วยลดข้อผิดพลาดในการฉายภาพทั้งหมด ช่องว่างระหว่างพิกเซลที่สังเกตได้และตำแหน่งที่จุด 3D โดยประมาณฉายซ้ำในกล้องทั้งหมดและจุดต่างๆ พร้อมกัน ร่วมกันปรับปรุงโครงสร้างภายใน ท่าทาง และโครงสร้างร่วมกัน

การเรียนรู้โฟโตแกรมเมทรี

โฟโตแกรมเมทรีเปลี่ยนภาพถ่ายที่ทับซ้อนกันธรรมดาๆ ให้กลายเป็นโมเดล 3 มิติ แผนที่ และการวัดที่แม่นยำ สิ่งสำคัญคือช่วยให้ทุกคนสร้างเรขาคณิตในโลกแห่งความเป็นจริงขึ้นใหม่ได้ในวงกว้างโดยใช้เพียงกล้อง ตั้งแต่การสำรวจด้วยโดรนไปจนถึงการแปลงสิ่งประดิษฐ์ในพิพิธภัณฑ์ให้เป็นดิจิทัล Photogrammetry เป็นของเวิร์กโฟลว์คอมพิวเตอร์วิทัศน์ที่ตีความหรือสร้างสื่อภาพเพื่อการวิเคราะห์ การดำเนินงาน และความคิดสร้างสรรค์ หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Photogrammetry เป็นเพียงแบบจำลองการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งใช้ความแม่นยำของโฟโตแกรมเมทรีกับความเป็นจริงในการปฏิบัติงาน เช่น คุณภาพของข้อมูล ความแปรปรวนของแสง และความสม่ำเสมอของการติดฉลาก โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในขณะเดียวกัน สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ

Visual AI สามารถทำให้การตรวจสอบ การตรวจจับ และการแท็กเป็นอัตโนมัติในขนาดต่างๆ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง

ทีมสร้างสรรค์สามารถสร้างต้นแบบแนวคิดได้รวดเร็วขึ้นโดยต้องมีการแก้ไขด้วยตนเองน้อยลง ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก

การดำเนินการสามารถใช้สัญญาณภาพและวิดีโอที่ก่อนหน้านี้ประมวลผลได้ยาก ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของโฟโตแกรมเมทรี

Photogrammetry ถูกหลอมรวมเข้ากับวิธีการทางประสาทมากขึ้น เครื่องมือจับคู่ฟีเจอร์ที่เรียนรู้ เช่น SuperPoint และ SuperGlue มีประสิทธิภาพเหนือกว่าเครื่องตรวจจับแบบคลาสสิกในฉากที่ยากลำบาก และการเรนเดอร์ระบบประสาท (NeRF, Gaussian Splatting) กำลังผสมผสานกับโฟโตแกรมเมทรีเพื่อเติมเต็มช่องว่างและสร้างเนื้อหาที่สมจริงเหมือนแสงและปรับแสงได้ คาดหวังการจับภาพบนมือถือแบบเรียลไทม์ที่เข้มงวดยิ่งขึ้น การรวมกล้อง LiDAR อัตโนมัติ และการล้างข้อมูล AI ที่จะลบวัตถุที่เคลื่อนไหวและการสะท้อน ทำให้ขั้นตอนการสร้าง 3D ใหม่ที่เชื่อถือได้บนโทรศัพท์ของผู้บริโภค

การใช้งานจริงในโลกแห่งความเป็นจริง

การสำรวจทางอากาศโดยใช้โดรนสร้างแผนที่ภูมิประเทศและการประมาณปริมาณสำหรับสถานที่ก่อสร้างและเหมืองแร่

การแปลงแหล่งโบราณคดีและสิ่งประดิษฐ์ของพิพิธภัณฑ์ให้เป็นโมเดล 3 มิติที่มีความเที่ยงตรงสูงเพื่อการอนุรักษ์และการศึกษา

การสร้างเนื้อหาการสแกน 3 มิติที่เหมือนจริง (หิน กำแพง อุปกรณ์ประกอบฉาก) สำหรับวิดีโอเกมและเอฟเฟกต์ภาพภาพยนตร์

สถานที่เกิดเหตุทางนิติเวชและการสร้างอุบัติเหตุขึ้นใหม่ บันทึกบันทึก 3 มิติที่วัดได้อย่างแม่นยำจากภาพถ่าย

รูปแบบการดำเนินงาน

โฟโตแกรมเมทรีในทางปฏิบัติ

การสำรวจทางอากาศโดยใช้โดรนสร้างแผนที่ภูมิประเทศและการประมาณปริมาณสำหรับสถานที่ก่อสร้างและเหมืองแร่

การสำรวจทางอากาศโดยใช้โดรนสร้างแผนที่ภูมิประเทศและการประมาณปริมาณสำหรับสถานที่ก่อสร้างและเหมืองแร่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

โฟโตแกรมเมทรีในทางปฏิบัติ

การแปลงแหล่งโบราณคดีและสิ่งประดิษฐ์ของพิพิธภัณฑ์ให้เป็นโมเดล 3 มิติที่มีความเที่ยงตรงสูงเพื่อการอนุรักษ์และการศึกษา

การแปลงแหล่งโบราณคดีและสิ่งประดิษฐ์ของพิพิธภัณฑ์ให้เป็นดิจิทัลให้เป็นโมเดล 3 มิติที่มีความเที่ยงตรงสูงสำหรับการอนุรักษ์และการศึกษา ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งผลผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

โฟโตแกรมเมทรีในทางปฏิบัติ

การสร้างเนื้อหาการสแกน 3 มิติที่เหมือนจริง (หิน กำแพง อุปกรณ์ประกอบฉาก) สำหรับวิดีโอเกมและเอฟเฟกต์ภาพภาพยนตร์

การสร้างแอสเซทการสแกน 3 มิติเสมือนจริง (หิน กำแพง อุปกรณ์ประกอบฉาก) สำหรับวิดีโอเกมและวิชวลเอฟเฟกต์ภาพยนตร์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

โฟโตแกรมเมทรีในทางปฏิบัติ

สถานที่เกิดเหตุทางนิติเวชและการสร้างอุบัติเหตุขึ้นใหม่ บันทึกบันทึก 3 มิติที่วัดได้อย่างแม่นยำจากภาพถ่าย

การสร้างสถานที่เกิดเหตุทางนิติวิทยาศาสตร์และอุบัติเหตุขึ้นใหม่ การจับภาพบันทึก 3 มิติที่วัดได้อย่างแม่นยำจากภาพถ่าย ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

สิทธิ์และความยินยอมในรูปภาพอาจกลายเป็นความเสี่ยงทางกฎหมายได้หากแหล่งที่มาไม่ชัดเจน

!

ประสิทธิภาพของโมเดลอาจแตกต่างกันไปตามสภาพแสง ข้อมูลประชากร และสภาพแวดล้อม

!

ผลบวกลวงอาจไม่สังเกตเห็นเว้นแต่จะมีการตรวจสอบเกณฑ์ความเชื่อมั่น

แผนงานการดำเนินงาน

1

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด

กำหนดเกณฑ์การยอมรับสำหรับความแม่นยำ การเรียกคืน และต้นทุนข้อผิดพลาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง

ทดสอบด้วยข้อมูลที่ตรงกับเงื่อนไขการผลิตจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง

เพิ่มการตรวจสอบโดยเจ้าหน้าที่สำหรับการคาดการณ์ที่มีความมั่นใจต่ำหรือมีผลกระทบสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล

ติดตามการเคลื่อนตัวของโมเดลและตรวจสอบความถูกต้องอีกครั้งหลังจากการเปลี่ยนแปลงกล้องหรือชุดข้อมูล ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป