คู่มือทางเทคนิค

การเรียนรู้ที่ตรงกันข้าม

การเรียนรู้แบบตรงกันข้ามจะสอนแบบจำลองเพื่อดึงสิ่งที่คล้ายกันมารวมกันและผลักสิ่งที่แตกต่างออกจากกันในพื้นที่ฝังตัว

ภาพรวม

การเรียนรู้แบบตรงกันข้ามจะสอนแบบจำลองเพื่อดึงสิ่งที่คล้ายกันมารวมกันและผลักสิ่งที่แตกต่างออกจากกันในพื้นที่ฝังตัว เป็นเรื่องสำคัญเนื่องจากช่วยให้ AI เรียนรู้การนำเสนอที่มีประสิทธิภาพจากข้อมูลที่ไม่มีป้ายกำกับเป็นส่วนใหญ่ ขับเคลื่อนการค้นหารูปภาพ คำแนะนำ และแบบจำลองหลายรูปแบบ

Contrastive Learning เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

แทนที่จะทำนายป้ายกำกับ การเรียนรู้แบบเปรียบเทียบจะเรียนรู้โดยการเปรียบเทียบ: เมื่อพิจารณาจากรายการจุดยึด โมเดลจะได้รับการฝึกเพื่อให้ 'ค่าบวก' ที่ตรงกันเข้าใกล้มันในปริภูมิเวกเตอร์ ในขณะที่ 'ค่าลบ' ที่ไม่ตรงกันจะตกลงไปในระยะไกล สูตรทั่วไปที่มีการดูแลตนเอง (เช่น SimCLR) จะสร้างผลบวกโดยการสุ่มเพิ่มรูปภาพเดียวกันสองครั้ง (ครอบตัด สีที่กระวนกระวายใจ เบลอ) อย่างอื่นในชุดนั้นเป็นค่าลบ แบบจำลองจะจับคู่อินพุตกับเวกเตอร์ และการสูญเสียจะให้รางวัลความคล้ายคลึงกันสูงสำหรับทั้งคู่ และความคล้ายคลึงกันต่ำสำหรับส่วนที่เหลือ สิ่งนี้ทำให้เกิดการฝังที่ระยะทางสะท้อนถึงความหมาย ดังนั้นงานปลายน้ำจึงจำเป็นต้องมีป้ายกำกับน้อยกว่ามาก CLIP ใช้แนวคิดเดียวกันในรูปแบบต่างๆ โดยจับคู่รูปภาพกับคำบรรยาย

ข้อมูลเชิงลึกทางเทคนิค

การสูญเสียน้ำหนักเทียมคือ InfoNCE (ค่าซอฟต์แม็กซ์เหนือคะแนนความคล้ายคลึงกัน) โดยมักจะมีความคล้ายคลึงกันของโคไซน์หารด้วยอุณหภูมิที่ควบคุมว่าต้องการให้ค่าบวกมากเพียงใด สิ่งสำคัญที่สุดคือประสิทธิภาพได้รับการปรับปรุงโดยมีข้อเสียหลายประการ ดังนั้นแบทช์ขนาดใหญ่หรือธนาคารหน่วยความจำ/คิว (เช่นใน MoCo) จึงจัดหาสิ่งเหล่านี้ วิธีการบางอย่าง เช่น BYOL และ SimSiam ทิ้งผลเชิงลบที่ชัดเจน และใช้โมเมนตัมหรือเครือข่ายเป้าหมายแบบหยุดการไล่ระดับสีแทนเพื่อหลีกเลี่ยงการล่มสลาย ซึ่งการฝังทั้งหมดจะเหมือนกัน

การเรียนรู้การเรียนรู้แบบตรงกันข้าม

การเรียนรู้แบบตรงกันข้ามจะสอนแบบจำลองเพื่อดึงสิ่งที่คล้ายกันมารวมกันและผลักสิ่งที่แตกต่างออกจากกันในพื้นที่ฝังตัว เป็นเรื่องสำคัญเนื่องจากช่วยให้ AI เรียนรู้การนำเสนอที่มีประสิทธิภาพจากข้อมูลที่ไม่มีป้ายกำกับเป็นส่วนใหญ่ ขับเคลื่อนการค้นหารูปภาพ คำแนะนำ และแบบจำลองหลายรูปแบบ Contrastive Learning เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการเรียนรู้แบบตรงกันข้ามเป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้การเรียนรู้แบบตรงกันข้ามจะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการเรียนรู้ที่ตรงกันข้าม

การเรียนรู้แบบตรงกันข้ามกำลังมาบรรจบกับการกำกับดูแลตนเองแบบปิดบังและแบบสร้างสรรค์ในวัตถุประสงค์แบบผสมผสานที่จับทั้งความคล้ายคลึงระดับโลกและรายละเอียดที่ละเอียด ผลกระทบที่ใหญ่ที่สุดของมันคือ multimodal: การฝังข้อความรูปภาพและการจัดแนวที่ตรงกันข้าม (และตอนนี้คือเสียงและวิดีโอ) จะสนับสนุนการค้นหา การสร้างเสริมการดึงข้อมูล และการจำแนกประเภทภาพเป็นศูนย์ และรอยเท้าดังกล่าวจะเติบโตขึ้น คาดว่าจะมีการทำงานมากขึ้นในการลดความอยากอาหารจำนวนมาก กลยุทธ์การเพิ่มและการขุดเชิงลบที่ดีขึ้น และในการขยายแนวทางไปยังโดเมน เช่น การสร้างภาพทางการแพทย์และอนุกรมเวลา ซึ่งฉลากหายากและมีราคาแพง

การใช้งานจริงในโลกแห่งความเป็นจริง

CLIP เรียนรู้พื้นที่ข้อความรูปภาพที่ใช้ร่วมกัน เพื่อให้คุณสามารถค้นหาไลบรารีรูปภาพด้วยวลีที่พิมพ์เช่น 'สุนัขบนสเก็ตบอร์ด'

ฝึกอบรมแกนหลักการมองเห็นล่วงหน้าด้วย SimCLR บนภาพถ่ายที่ไม่มีป้ายกำกับ จากนั้นปรับแต่งอย่างละเอียดเพื่อการตรวจหาโรคด้วยชุดป้ายกำกับขนาดเล็กเท่านั้น

สร้างคำแนะนำผลิตภัณฑ์หรือเพลงโดยฝังรายการที่ผู้ใช้ชอบไว้ใกล้กันเพื่อเรียกดูเพื่อนบ้านที่ใกล้ที่สุด

ระบบการตรวจสอบใบหน้าที่ฝึกการฝังเพื่อให้รูปถ่ายสองรูปของคนคนเดียวกันอยู่ใกล้กันและคนละคนกัน

รูปแบบการดำเนินงาน

การเรียนรู้ที่ตรงกันข้ามในทางปฏิบัติ

CLIP เรียนรู้พื้นที่ข้อความรูปภาพที่ใช้ร่วมกัน เพื่อให้คุณสามารถค้นหาไลบรารีรูปภาพด้วยวลีที่พิมพ์เช่น 'สุนัขบนสเก็ตบอร์ด'

CLIP เรียนรู้พื้นที่ข้อความรูปภาพที่ใช้ร่วมกัน เพื่อให้คุณสามารถค้นหาไลบรารีรูปภาพด้วยวลีที่พิมพ์ เช่น 'สุนัขบนสเก็ตบอร์ด' ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การเรียนรู้ที่ตรงกันข้ามในทางปฏิบัติ

ฝึกอบรมแกนหลักการมองเห็นล่วงหน้าด้วย SimCLR บนภาพถ่ายที่ไม่มีป้ายกำกับ จากนั้นปรับแต่งอย่างละเอียดเพื่อการตรวจหาโรคด้วยชุดป้ายกำกับขนาดเล็กเท่านั้น

ฝึกฝนแกนหลักการมองเห็นล่วงหน้าด้วย SimCLR บนภาพถ่ายที่ไม่มีป้ายกำกับ จากนั้นปรับแต่งอย่างละเอียดสำหรับการตรวจหาโรคด้วยชุดที่มีป้ายกำกับขนาดเล็กเท่านั้น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การเรียนรู้ที่ตรงกันข้ามในทางปฏิบัติ

สร้างคำแนะนำผลิตภัณฑ์หรือเพลงโดยฝังรายการที่ผู้ใช้ชอบไว้ใกล้กันเพื่อเรียกดูเพื่อนบ้านที่ใกล้ที่สุด

การสร้างคำแนะนำผลิตภัณฑ์หรือเพลงโดยฝังรายการที่ผู้ใช้ชอบนั่งใกล้กันเพื่อดึงข้อมูลเพื่อนบ้านที่ใกล้ที่สุด มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การเรียนรู้ที่ตรงกันข้ามในทางปฏิบัติ

ระบบการตรวจสอบใบหน้าที่ฝึกการฝังเพื่อให้รูปถ่ายสองรูปของคนคนเดียวกันอยู่ใกล้กันและคนละคนกัน

ระบบการตรวจสอบใบหน้าที่ฝึกการฝังเพื่อให้ภาพถ่ายสองภาพของบุคคลเดียวกันอยู่ใกล้กันและบุคคลต่างกันอยู่ห่างจากกัน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป