คู่มือแอปพลิเคชัน

รูปแบบตัวแทน ReAct

ReAct (การใช้เหตุผลและการแสดง) คือรูปแบบการออกแบบที่โมเดล AI แทรกการให้เหตุผลแบบทีละขั้นตอนด้วยการดำเนินการที่เป็นรูปธรรม เช่น การเรียกใช้เครื่องมือหรือการค้นหา

ภาพรวม

ReAct (การใช้เหตุผลและการแสดง) คือรูปแบบการออกแบบที่โมเดล AI แทรกการให้เหตุผลแบบทีละขั้นตอนด้วยการดำเนินการที่เป็นรูปธรรม เช่น การเรียกใช้เครื่องมือหรือการค้นหา เป็นเรื่องสำคัญเพราะช่วยให้โมเดลภาษาจัดการกับปัญหาหลายขั้นตอนและยึดคำตอบด้วยข้อมูลจริงและทันสมัยแทนการคาดเดา

ReAct Agent Pattern มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้

เจาะลึก

ReAct เปิดตัวในรายงานการวิจัยปี 2022 โดยผสมผสานสองแนวคิดที่เคยใช้แยกกันก่อนหน้านี้ ได้แก่ การใช้เหตุผลแบบลูกโซ่ (แบบจำลอง 'คิดออกมาดัง ๆ') และการใช้เครื่องมือ (แบบจำลองดำเนินการ) ในลูป ReAct โมเดลจะสร้างความคิดที่อธิบายแผน การดำเนินการ เช่น คำค้นหาหรือการเรียก API จากนั้นจะได้รับการสังเกตซึ่งเป็นผลลัพธ์ของการกระทำนั้น โดยจะทำซ้ำวงจรการคิด-การกระทำ-การสังเกต โดยอัปเดตเหตุผลเมื่อมีข้อมูลใหม่เข้ามา จนกว่าจะสามารถให้คำตอบสุดท้ายได้ การสลับกันนี้ช่วยให้โมเดลตัดสินใจว่ายังจำเป็นต้องรู้อะไรและไปรับโมเดลนั้นมา ReAct กลายเป็นพิมพ์เขียวพื้นฐานสำหรับตัวแทน AI สมัยใหม่ และสนับสนุนเฟรมเวิร์กตัวแทนจำนวนมากที่ใช้ในการสร้างผู้ช่วยที่เรียกดู ค้นหาฐานข้อมูล และใช้งานซอฟต์แวร์

ข้อมูลเชิงลึกทางเทคนิค

โดยทั่วไป ReAct จะถูกนำไปใช้ผ่านการแจ้ง: โมเดลจะแสดงรูปแบบและส่งเสียงข้อความเช่น 'Thought: ...', 'Action: search[query]' จากนั้นระบบจะแยกวิเคราะห์การดำเนินการ รันเครื่องมือจริง และป้อนกลับ 'Observation: ...' เนื่องจากร่องรอยการให้เหตุผลสอดแทรกกับการสังเกตที่มีพื้นฐาน แบบจำลองจึงสามารถแก้ไขทิศทางและลดอาการประสาทหลอนได้ เมื่อเทียบกับห่วงโซ่แห่งความคิดล้วนๆ การวนซ้ำจะดำเนินต่อไปจนกว่าโมเดลจะส่งเอาต์พุตการดำเนินการ 'เสร็จสิ้น' พร้อมคำตอบ โดยมีการจำกัดขั้นตอนเพื่อป้องกันการวนซ้ำที่ไม่มีที่สิ้นสุด

การเรียนรู้รูปแบบตัวแทน ReAct

ReAct (การใช้เหตุผลและการแสดง) คือรูปแบบการออกแบบที่โมเดล AI แทรกการให้เหตุผลแบบทีละขั้นตอนด้วยการดำเนินการที่เป็นรูปธรรม เช่น การเรียกใช้เครื่องมือหรือการค้นหา เป็นเรื่องสำคัญเพราะช่วยให้โมเดลภาษาจัดการกับปัญหาหลายขั้นตอนและยึดคำตอบด้วยข้อมูลจริงและทันสมัยแทนการคาดเดา ReAct Agent Pattern มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้ หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า ReAct Agent Pattern เป็นโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ ReAct Agent Pattern มุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของรูปแบบ ReAct Agent

ReAct ยังคงเป็นแนวคิดหลัก แต่เอเจนต์รุ่นใหม่ได้ขยายขอบเขตออกไปด้วยการวางแผนที่ชัดเจน หน่วยความจำข้ามขั้นตอน การไตร่ตรองตนเองเกี่ยวกับความล้มเหลว และการเรียกใช้เครื่องมือแบบขนาน แทนที่จะดำเนินการทีละอย่างอย่างเคร่งครัด โมเดล Frontier ใช้เหตุผลนี้โดยกำเนิดมากขึ้นเรื่อยๆ แทนที่จะใช้คำสั่งที่เขียนด้วยลายมือ คาดหวังการกู้คืนข้อผิดพลาดที่มีประสิทธิภาพมากขึ้น การตรวจสอบแต่ละขั้นตอนที่ดีขึ้น และรูปแบบไฮบริดที่ผสมผสานการทำงานตามที่คุณคิดของ ReAct เข้ากับการวางแผนล่วงหน้าสำหรับงานที่ซับซ้อนในขอบเขตระยะยาว เช่น การวิจัยและวิศวกรรมซอฟต์แวร์

การใช้งานจริงในโลกแห่งความเป็นจริง

ผู้ช่วยตอบคำถามค้นหาเว็บ อ่านผลลัพธ์ ปรับแต่งคำถาม และค้นหาอีกครั้งก่อนที่จะตอบคำถามข้อเท็จจริงที่มีหลายส่วน

ตัวแทนฝ่ายสนับสนุนลูกค้าให้เหตุผลเกี่ยวกับปัญหาของผู้ใช้ เรียก API ค้นหาคำสั่งซื้อ สังเกตสถานะคำสั่งซื้อ จากนั้นตัดสินใจว่าจะคืนเงินหรือไม่

เอเจนต์การเขียนโค้ดอ่านข้อความแสดงข้อผิดพลาด ตัดสินใจว่าไฟล์ใดที่จะตรวจสอบ รันคำสั่ง สังเกตเอาต์พุต และวนซ้ำจนกว่าการทดสอบจะผ่าน

บอทการวิเคราะห์ข้อมูลตีความคำถาม ค้นหาฐานข้อมูล ดูแถวที่ส่งคืน และให้เหตุผลว่าจำเป็นต้องมีการสืบค้นอื่นหรือไม่

รูปแบบการดำเนินงาน

รูปแบบ ReAct Agent ในทางปฏิบัติ

ผู้ช่วยตอบคำถามค้นหาเว็บ อ่านผลลัพธ์ ปรับแต่งคำถาม และค้นหาอีกครั้งก่อนที่จะตอบคำถามข้อเท็จจริงที่มีหลายส่วน

ผู้ช่วยตอบคำถามจะค้นหาเว็บ อ่านผลลัพธ์ ปรับแต่งคำถาม และค้นหาอีกครั้งก่อนตอบคำถามข้อเท็จจริงที่มีหลายส่วน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

รูปแบบ ReAct Agent ในทางปฏิบัติ

ตัวแทนฝ่ายสนับสนุนลูกค้าให้เหตุผลเกี่ยวกับปัญหาของผู้ใช้ เรียก API ค้นหาคำสั่งซื้อ สังเกตสถานะคำสั่งซื้อ จากนั้นตัดสินใจว่าจะคืนเงินหรือไม่

ตัวแทนฝ่ายสนับสนุนลูกค้าให้เหตุผลเกี่ยวกับปัญหาของผู้ใช้ เรียก API การค้นหาคำสั่งซื้อ สังเกตสถานะคำสั่งซื้อ จากนั้นตัดสินใจว่าจะคืนเงินหรือไม่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

รูปแบบ ReAct Agent ในทางปฏิบัติ

เอเจนต์การเขียนโค้ดอ่านข้อความแสดงข้อผิดพลาด ตัดสินใจว่าไฟล์ใดที่จะตรวจสอบ รันคำสั่ง สังเกตเอาต์พุต และวนซ้ำจนกว่าการทดสอบจะผ่าน

เอเจนต์การเขียนโค้ดจะอ่านข้อความแสดงข้อผิดพลาด ตัดสินใจว่าไฟล์ใดที่จะตรวจสอบ รันคำสั่ง สังเกตผลลัพธ์ และวนซ้ำจนกว่าการทดสอบจะผ่าน โดยทั่วไปทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

รูปแบบ ReAct Agent ในทางปฏิบัติ

บอทการวิเคราะห์ข้อมูลตีความคำถาม ค้นหาฐานข้อมูล ดูแถวที่ส่งคืน และให้เหตุผลว่าจำเป็นต้องมีการสืบค้นอื่นหรือไม่

บอทการวิเคราะห์ข้อมูลตีความคำถาม สอบถามฐานข้อมูล ดูแถวที่ส่งคืน และเหตุผลที่ว่าจำเป็นต้องมีการสืบค้นอื่นหรือไม่ โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้

!

ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก

!

คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง

แผนงานการดำเนินงาน

1

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป