คู่มือทางเทคนิค

การสะท้อนตนเองใน Agent Loops

การสะท้อนตนเองช่วยให้เจ้าหน้าที่ AI วิจารณ์ผลลัพธ์และการดำเนินการของตนเองในระหว่างงาน จากนั้นแก้ไขตามคำวิจารณ์นั้น

ภาพรวม

การสะท้อนตนเองช่วยให้เจ้าหน้าที่ AI วิจารณ์ผลลัพธ์และการดำเนินการของตนเองระหว่างทำงาน จากนั้นแก้ไขตามคำวิจารณ์นั้น มันเปลี่ยนผู้เดาแบบนัดเดียวเป็นระบบที่จับและแก้ไขข้อผิดพลาดของตัวเอง

การสะท้อนตนเองใน Agent Loops เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

ในลูปตัวแทน โมเดลภาษาจะดำเนินการ (การเรียกใช้เครื่องมือ การเขียนโค้ด การตอบรับ) สังเกตผลลัพธ์ และตัดสินใจว่าจะทำอย่างไรต่อไป การสะท้อนตนเองเพิ่มขั้นตอนโดยเจตนาโดยที่แบบจำลองจะประเมินงานล่าสุดก่อนดำเนินการต่อ กรอบงานเช่น Reflexion (2023) ทำให้สิ่งนี้เป็นรูปธรรม: หลังจากความพยายามล้มเหลว เจ้าหน้าที่จะเขียนคำวิจารณ์ด้วยวาจาสั้นๆ ('ฉันลืมจัดการกรณีรายการว่าง') และเก็บไว้ในหน่วยความจำ ดังนั้นความพยายามครั้งถัดไปจึงถูกกำหนดเงื่อนไขในบทเรียนนั้น Self-Refine ใช้โมเดลเดียวกันเพื่อสร้างคำติชม จากนั้นจึงเขียนคำตอบใหม่ซ้ำๆ การสะท้อนอาจมาจากการเปรียบเทียบเอาต์พุตกับเป้าหมาย การตรวจสอบข้อความแสดงข้อผิดพลาด หรือการรันการทดสอบ ผลตอบแทนที่ได้คือความน่าเชื่อถือที่สูงกว่าในงานที่มีหลายขั้นตอน เช่น การเขียนโค้ด การนำทางเว็บ และคณิตศาสตร์ โดยที่การส่งผ่านครั้งเดียวมักจะล้มเหลวแต่การวนซ้ำการวิจารณ์และลองใหม่กลับประสบผลสำเร็จ

ข้อมูลเชิงลึกทางเทคนิค

การสะท้อนกลับมักจะถูกนำมาใช้เป็นการแจ้งเตือนเพิ่มเติม: โมเดลจะถูกขอให้ทำหน้าที่เป็นนักวิจารณ์เกี่ยวกับบันทึกการกระทำของตัวเอง ทำให้เกิดผลตอบรับในภาษาธรรมชาติ จากนั้นจะถูกผนวกเข้ากับบริบทสำหรับความพยายามครั้งต่อไป การสะท้อนกลับเก็บคำวิจารณ์เหล่านี้ไว้ในบัฟเฟอร์หน่วยความจำแบบเป็นตอนตลอดการทดลอง แทนที่จะปรับน้ำหนักอย่างละเอียด ดังนั้นการเรียนรู้จึงเกิดขึ้นในบริบททั้งหมด การสะท้อนของแรงขับของสัญญาณอาจเป็นสัญญาณภายนอก (ทดสอบผ่าน/ไม่ผ่าน ข้อผิดพลาดของเครื่องมือ) หรือสร้างขึ้นเอง และสัญญาณภายนอกมีแนวโน้มที่จะเชื่อถือได้มากกว่ามาก

ฝึกฝนการสะท้อนตนเองใน Agent Loops

การสะท้อนตนเองช่วยให้เจ้าหน้าที่ AI วิจารณ์ผลลัพธ์และการดำเนินการของตนเองระหว่างทำงาน จากนั้นแก้ไขตามคำวิจารณ์นั้น มันเปลี่ยนผู้เดาแบบนัดเดียวเป็นระบบที่จับและแก้ไขข้อผิดพลาดของตัวเอง การสะท้อนตนเองใน Agent Loops เป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Self-Reflection ใน Agent Loops เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Self-Reflection ใน Agent Loops จะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการสะท้อนตนเองใน Agent Loops

คาดว่าการสะท้อนกลับจะกลายเป็นเอเจนต์ดั้งเดิมในตัวแทนที่จะเป็นกลอุบายกระตุ้น โดยมีโมเดลที่ได้รับการฝึกฝนให้รู้ว่าเมื่อใดการสะท้อนกลับมีค่าเท่ากับโทเค็นพิเศษ และเมื่อใดที่เป็นเพียงการเบิร์นการคำนวณ โมเดลผู้ตรวจสอบและข้อเสนอแนะในการดำเนินการจะนำไปสู่การวิพากษ์วิจารณ์ตนเองมากขึ้น ดังนั้นเจ้าหน้าที่จึงหยุดเข้าใจผิดว่าคำตอบที่ผิดนั้นถูกต้อง การวิจัยยังมุ่งเป้าไปที่โหมดความล้มเหลวซึ่งโมเดลยืนยันการทำงานที่ไม่ดีอย่างมั่นใจ โดยผลักดันไปสู่การปรับเทียบ การสะท้อนตามหลักฐานเชิงประจักษ์ และการเรียนรู้เกณฑ์การหยุดสำหรับลูป

การใช้งานจริงในโลกแห่งความเป็นจริง

เอเจนต์การเขียนโค้ดรันการทดสอบหน่วยที่ล้มเหลว อ่านการย้อนกลับ เขียนการสะท้อนโดยสังเกตข้อผิดพลาดแบบ off-by-one และเขียนฟังก์ชันใหม่ในการวนซ้ำครั้งถัดไป

ตัวแทนการท่องเว็บที่คลิกลิงก์ที่ไม่ถูกต้องจะสะท้อนไปยังหน้าที่ลิงก์นั้นไป รับรู้ถึงเป้าหมายที่ไม่ตรงกัน และย้อนกลับเพื่อลองใช้ลิงก์อื่น

ผู้ช่วยวิจัยร่างคำตอบ วิพากษ์วิจารณ์การกล่าวอ้างที่ไม่สนับสนุน และแก้ไขเพื่อเพิ่มการอ้างอิงหรือป้องกันข้อความที่ไม่แน่นอนก่อนส่งคืน

เจ้าหน้าที่แก้ปัญหาทางคณิตศาสตร์จะตรวจสอบคำตอบสุดท้ายกับข้อจำกัดของปัญหา สังเกตเห็นหน่วยที่ไม่ตรงกัน และปรับปรุงการคำนวณใหม่แทนที่จะส่งผลลัพธ์ที่มีข้อบกพร่อง

รูปแบบการดำเนินงาน

การสะท้อนตนเองใน Agent Loops ในทางปฏิบัติ

เอเจนต์การเขียนโค้ดรันการทดสอบหน่วยที่ล้มเหลว อ่านการย้อนกลับ เขียนการสะท้อนโดยสังเกตข้อผิดพลาดแบบ off-by-one และเขียนฟังก์ชันใหม่ในการวนซ้ำครั้งถัดไป

เอเจนต์การเขียนโค้ดเรียกใช้การทดสอบหน่วยที่ล้มเหลว อ่านการย้อนกลับ เขียนการสะท้อนโดยสังเกตข้อผิดพลาดแบบออฟ-ต่อ-หนึ่ง และเขียนฟังก์ชันใหม่ในการทำซ้ำลูปถัดไป ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสะท้อนตนเองใน Agent Loops ในทางปฏิบัติ

ตัวแทนการท่องเว็บที่คลิกลิงก์ที่ไม่ถูกต้องจะสะท้อนไปยังหน้าที่ลิงก์นั้นไป รับรู้ถึงเป้าหมายที่ไม่ตรงกัน และย้อนกลับเพื่อลองใช้ลิงก์อื่น

เอเจนต์การเรียกดูเว็บที่คลิกลิงก์ที่ไม่ถูกต้องจะสะท้อนไปยังเพจที่ลิงก์ไป รับรู้ถึงเป้าหมายที่ไม่ตรงกัน และย้อนกลับเพื่อลองใช้ลิงก์อื่น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสะท้อนตนเองใน Agent Loops ในทางปฏิบัติ

ผู้ช่วยวิจัยร่างคำตอบ วิพากษ์วิจารณ์การกล่าวอ้างที่ไม่สนับสนุน และแก้ไขเพื่อเพิ่มการอ้างอิงหรือป้องกันข้อความที่ไม่แน่นอนก่อนส่งคืน

ผู้ช่วยวิจัยร่างคำตอบ วิพากษ์วิจารณ์การอ้างสิทธิ์ที่ไม่ได้รับการสนับสนุน และแก้ไขเพื่อเพิ่มการอ้างอิงหรือป้องกันข้อความที่ไม่แน่นอนก่อนที่จะส่งคืน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสะท้อนตนเองใน Agent Loops ในทางปฏิบัติ

เจ้าหน้าที่แก้ปัญหาทางคณิตศาสตร์จะตรวจสอบคำตอบสุดท้ายกับข้อจำกัดของปัญหา สังเกตเห็นหน่วยที่ไม่ตรงกัน และปรับปรุงการคำนวณใหม่แทนที่จะส่งผลลัพธ์ที่มีข้อบกพร่อง

เจ้าหน้าที่แก้ปัญหาทางคณิตศาสตร์จะตรวจสอบคำตอบสุดท้ายกับข้อจำกัดของปัญหา สังเกตเห็นหน่วยที่ไม่ตรงกัน และทำการคำนวณใหม่ แทนที่จะส่งผลลัพธ์ที่มีข้อบกพร่อง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งผลผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป