คู่มือ AI ภาษา

คำสาปการกลับรายการใน LLM

คำสาปผกผันเป็นโหมดความล้มเหลวที่น่าประหลาดใจ โดยที่แบบจำลองภาษาที่เรียนรู้ 'A คือ B' ไม่สามารถตอบ 'B คือ A' ได้อย่างน่าเชื่อถือ

ภาพรวม

คำสาปผกผันเป็นโหมดความล้มเหลวที่น่าประหลาดใจ โดยที่แบบจำลองภาษาที่เรียนรู้ 'A คือ B' ไม่สามารถตอบ 'B คือ A' ได้อย่างน่าเชื่อถือ โดยเผยให้เห็นว่า LLM เก็บข้อเท็จจริงไว้เป็นการเชื่อมโยงแบบทิศทางเดียว ไม่ใช่เป็นความรู้แบบสมมาตร

Reversal Curse ใน LLM เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด

เจาะลึก

คำสาปพลิกกลับที่บันทึกไว้ในรายงานปี 2023 โดย Berglund และเพื่อนร่วมงานแสดงให้เห็นว่า หากนางแบบได้รับการฝึกฝนเกี่ยวกับ 'แม่ของ Tom Cruise คือ Mary Lee Pfeiffer' ก็มักจะล้มเหลวเมื่อถูกถามว่า 'ลูกชายของ Mary Lee Pfeiffer คือใคร' แม้ว่าคำตอบจะเหมือนกันในเชิงตรรกะก็ตาม ผลกระทบจะคงอยู่ตามขนาดโมเดลและแม้กระทั่งหลังจากการปรับแต่งข้อเท็จจริงดังกล่าวอย่างละเอียดหลายร้อยรายการแล้ว ไม่ใช่ช่องว่างของหน่วยความจำ โมเดลเห็นข้อมูลแล้ว แต่อยู่ในลำดับเดียวเท่านั้น เนื่องจากการฝึกอบรมปรับการทำนายโทเค็นถัดไปให้เหมาะสมเหนือลำดับคำที่แน่นอนในข้อมูล ลิงก์ทางสถิติจาก A ถึง B จะไม่สร้างลิงก์จาก B กลับไปยัง A โดยอัตโนมัติ การค้นพบสมมติฐานที่ท้าทายซึ่งขยายขนาดเพียงอย่างเดียวทำให้เกิดความยืดหยุ่นและให้เหตุผลที่เหมือนมนุษย์เหนือข้อเท็จจริง

ข้อมูลเชิงลึกทางเทคนิค

ทรานส์ฟอร์มเมอร์เรียนรู้โดยการทำนายโทเค็นถัดไปตามบริบทก่อนหน้า ดังนั้นการอัปเดตการไล่ระดับสีจะเสริมความแข็งแกร่งให้กับการแมปทิศทาง 'A จากนั้น B' แต่ปล่อย 'B จากนั้น A' ไว้โดยไม่มีใครแตะต้อง เว้นแต่ลำดับนั้นจะปรากฏในการฝึกด้วย ทั้งสองทิศทางอาศัยอยู่ในเส้นทางน้ำหนักที่แยกจากกัน นักวิจัยยืนยันสิ่งนี้โดยการวัดความน่าจะเป็นของบันทึก: หลังจากเรียนรู้ข้อเท็จจริงล่วงหน้า ความน่าจะเป็นของคำสั่งย้อนกลับยังคงอยู่ที่ระดับพื้นฐาน ซึ่งแสดงว่าไม่มีการผกผันเชิงตรรกะโดยปริยายเกิดขึ้นระหว่างการฝึก

การเรียนรู้คำสาปผกผันใน LLM

คำสาปผกผันเป็นโหมดความล้มเหลวที่น่าประหลาดใจ โดยที่แบบจำลองภาษาที่เรียนรู้ 'A คือ B' ไม่สามารถตอบ 'B คือ A' ได้อย่างน่าเชื่อถือ โดยเผยให้เห็นว่า LLM เก็บข้อเท็จจริงไว้เป็นการเชื่อมโยงแบบทิศทางเดียว ไม่ใช่เป็นความรู้แบบสมมาตร Reversal Curse ใน LLM เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Reversal Curse ใน LLM เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Reversal Curse ใน LLM จะออกแบบพร้อมท์ การดึงข้อมูล และการตรวจสอบลูปให้เป็นระบบการสื่อสารแบบรวมระบบเดียว โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในขณะเดียวกัน ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการกลับคำสาปใน LLM

การบรรเทาปัญหาภายใต้การศึกษา ได้แก่ การเพิ่มข้อมูลแบบสองทิศทาง (เพิ่มการใช้ถ้อยคำที่กลับกัน) วัตถุประสงค์การฝึกอบรมที่ทำนายโทเค็นในทั้งสองทิศทาง และระบบการดึงข้อมูลที่ค้นหาข้อเท็จจริงแบบสมมาตรแทนที่จะอาศัยน้ำหนักที่จดจำ สถาปัตยกรรมที่ใหม่กว่าและการทดลองเตรียมย้อนกลับช่วยลดช่องว่าง คาดหวังว่าคำสาปจะหดตัวแต่ไม่หายไป เนื่องจากเผยให้เห็นความไม่ตรงกันอย่างลึกซึ้งระหว่างการเรียนรู้โทเค็นถัดไปและโครงสร้างสมมาตรของความสัมพันธ์ในโลกแห่งความเป็นจริง

การใช้งานจริงในโลกแห่งความเป็นจริง

แชทบอตระบุผู้ปกครองของคนดังได้อย่างถูกต้อง แต่จะล้มเหลวเมื่อถูกขอให้ตั้งชื่อลูกที่มีชื่อเสียงของผู้ปกครองนั้น

นางแบบคนหนึ่งเล่าว่า 'ประธานาธิบดีคนที่เก้าคือวิลเลียม เฮนรี แฮร์ริสัน' แต่ก็สะดุดว่า 'ประธานาธิบดีคนไหนคือวิลเลียม เฮนรี แฮร์ริสัน'

ผู้ช่วยเขียนโค้ดที่เรียนรู้การแมปฟังก์ชันกับคำอธิบายไม่สามารถกู้คืนชื่อฟังก์ชันจากคำอธิบายเพียงอย่างเดียวได้

ระบบ QA ทางการแพทย์ที่ได้รับการฝึกอบรมเกี่ยวกับ 'ยา X รักษาอาการ Y' ไม่สามารถแสดงรายการยา X เมื่อถูกถามว่าอะไรรักษาอาการ Y

รูปแบบการดำเนินงาน

คำสาปการกลับรายการใน LLM ในทางปฏิบัติ

แชทบอตระบุผู้ปกครองของคนดังได้อย่างถูกต้อง แต่จะล้มเหลวเมื่อถูกขอให้ตั้งชื่อลูกที่มีชื่อเสียงของผู้ปกครองนั้น

แชทบอตระบุผู้ปกครองของคนดังอย่างถูกต้อง แต่ล้มเหลวเมื่อถูกขอให้ตั้งชื่อลูกที่มีชื่อเสียงของผู้ปกครอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำสาปการกลับรายการใน LLM ในทางปฏิบัติ

นางแบบคนหนึ่งเล่าว่า 'ประธานาธิบดีคนที่ 9 คือวิลเลียม เฮนรี แฮร์ริสัน' แต่ยังสะดุดว่า 'ประธานาธิบดีคนไหนคือวิลเลียม เฮนรี แฮร์ริสัน'

นางแบบคนหนึ่งเล่าว่า 'ประธานาธิบดีคนที่เก้าคือวิลเลียม เฮนรี แฮร์ริสัน' แต่ก็สะดุดว่า 'ประธานาธิบดีคนไหนคือวิลเลียม เฮนรี แฮร์ริสัน' โดยปกติทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำสาปการกลับรายการใน LLM ในทางปฏิบัติ

ผู้ช่วยเขียนโค้ดที่เรียนรู้การแมปฟังก์ชันกับคำอธิบายไม่สามารถกู้คืนชื่อฟังก์ชันจากคำอธิบายเพียงอย่างเดียวได้

ผู้ช่วยเขียนโค้ดที่เรียนรู้การแมปฟังก์ชันกับคำอธิบายไม่สามารถกู้คืนชื่อฟังก์ชันจากคำอธิบายเพียงอย่างเดียว ทีมมักจะได้ผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

คำสาปการกลับรายการใน LLM ในทางปฏิบัติ

ระบบ QA ทางการแพทย์ที่ได้รับการฝึกอบรมเกี่ยวกับ 'ยา X รักษาอาการ Y' ไม่สามารถแสดงรายการยา X เมื่อถูกถามว่าอะไรรักษาอาการ Y

ระบบ QA ทางการแพทย์ที่ได้รับการฝึกอบรมเกี่ยวกับ 'ยา X รักษาอาการ Y' ไม่สามารถแสดงรายการยา X เมื่อถูกถามว่าอะไรรักษาอาการ Y ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณีขอบ และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ

!

ความละเอียดอ่อนของการแจ้งเตือนสามารถสร้างผลลัพธ์ที่ไม่สอดคล้องกันในคำขอที่คล้ายกัน

!

ข้อมูลข้อความที่ละเอียดอ่อนอาจถูกเปิดเผยหากการควบคุมการเข้าถึงอ่อนแอ

แผนงานการดำเนินงาน

1

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป