คู่มือแอปพลิเคชัน

ตัวแทนผู้วางแผน-ผู้ดำเนินการ

ตัวแทนผู้วางแผนและผู้บริหารแบ่งระบบ AI ออกเป็นสองบทบาท ได้แก่ ผู้วางแผนที่แบ่งเป้าหมายออกเป็นขั้นตอน และผู้ดำเนินการที่ดำเนินการแต่ละขั้นตอน

ภาพรวม

ตัวแทนผู้วางแผนและผู้บริหารแบ่งระบบ AI ออกเป็นสองบทบาท ได้แก่ ผู้วางแผนที่แบ่งเป้าหมายออกเป็นขั้นตอน และผู้ดำเนินการที่ดำเนินการแต่ละขั้นตอน การแยกนี้ทำให้งานที่ซับซ้อนและหลายขั้นตอนมีความน่าเชื่อถือมากขึ้นและแก้ไขจุดบกพร่องได้ง่ายขึ้น

Planner-Executor Agents มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้

เจาะลึก

ตัวแทนผู้วางแผนและผู้บริหารแบ่งงานระหว่างการคิดและการทำ ผู้วางแผนตั้งเป้าหมายระดับสูง เช่น 'จองการเดินทางไปโตเกียวในราคาต่ำกว่า 2,000 ดอลลาร์' และแยกย่อยเป็นรายการงานย่อยตามลำดับ เช่น ค้นหาเที่ยวบิน เปรียบเทียบโรงแรม ตรวจสอบงบประมาณ ยืนยันการจอง จากนั้นผู้ดำเนินการจะจัดการงานย่อยแต่ละงาน โดยมักจะเรียกเครื่องมือ, API หรือโมเดลอื่นๆ สิ่งสำคัญที่สุดคือ การควบคุมจะวนกลับ: หลังจากที่ผู้ดำเนินการส่งคืนผลลัพธ์ ผู้วางแผนสามารถวางแผนใหม่ได้หากมีบางอย่างล้มเหลวหรือมีข้อมูลใหม่ปรากฏขึ้น บางครั้งเรียกว่ารูปแบบการวางแผนและแก้ไขหรือแบบลำดับชั้น การแบ่งบทบาทช่วยได้เนื่องจากโมเดลเดี่ยวที่พยายามวางแผนและดำเนินการในคราวเดียวมีแนวโน้มที่จะสูญเสียการติดตามเป้าหมาย ข้ามขั้นตอน หรือทำให้เกิดภาพหลอนความคืบหน้า การแยกพวกมันออกจากกันทำให้เจตนาระดับสูงคงที่ในขณะที่ผู้ดำเนินการโฟกัสอย่างแคบ

ข้อมูลเชิงลึกทางเทคนิค

โดยทั่วไปแล้ว อินสแตนซ์โมเดลหนึ่ง (หรือพร้อมต์) มีไว้สำหรับการวางแผนและสร้างรายการขั้นตอนที่มีโครงสร้าง ในขณะที่อินสแตนซ์ตัวดำเนินการที่แยกต่างหากจะรันแต่ละขั้นตอนด้วยการเข้าถึงเครื่องมือ สถานะ เช่น ขั้นตอนที่เสร็จสมบูรณ์และเอาต์พุตระดับกลาง จะถูกส่งกลับไปยังผู้วางแผนผ่านหน้าต่างบริบทหรือหน่วยความจำภายนอก การใช้งานหลายอย่างแทรกการวางแผนและการดำเนินการแบบวนซ้ำ (การวางแผนใหม่) แทนที่จะยอมรับแผนคงที่แผนเดียว ซึ่งจัดการกับข้อผิดพลาดและการเปลี่ยนแปลงเงื่อนไขอย่างสวยงาม

เชี่ยวชาญตัวแทนผู้วางแผน-ผู้ดำเนินการ

ตัวแทนผู้วางแผนและผู้บริหารแบ่งระบบ AI ออกเป็นสองบทบาท ได้แก่ ผู้วางแผนที่แบ่งเป้าหมายออกเป็นขั้นตอน และผู้ดำเนินการที่ดำเนินการแต่ละขั้นตอน การแยกนี้ทำให้งานที่ซับซ้อนและหลายขั้นตอนมีความน่าเชื่อถือมากขึ้นและแก้ไขจุดบกพร่องได้ง่ายขึ้น Planner-Executor Agents มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Planner-Executor Agent เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ตัวแทนการวางแผน-ผู้บริหารมุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของตัวแทนผู้วางแผน-ผู้บริหาร

คาดหวังการผสานรวมที่เข้มงวดยิ่งขึ้นกับการยืนยัน: ผู้วางแผนที่ประเมินความเชื่อมั่นต่อขั้นตอนและผู้ดำเนินการที่ตรวจสอบตนเองก่อนที่จะรายงานความสำเร็จ ลำดับชั้นจะลึกซึ้งยิ่งขึ้น โดยผู้วางแผนจะวางไข่ผู้วางแผนย่อยสำหรับสาขาที่ซับซ้อน รูปแบบการวางแผนที่เป็นมาตรฐานและการจัดเก็บหน่วยความจำที่ใช้ร่วมกันจะช่วยให้ทีมสลับผู้ดำเนินการ (รุ่นหรือเครื่องมือที่แตกต่างกัน) โดยไม่ต้องเขียนแผนใหม่ นอกจากนี้ การวิจัยยังมุ่งไปสู่นักวางแผนที่เรียนรู้จากการดำเนินการในอดีต โดยนำเทมเพลตแผนที่ประสบความสำเร็จมาใช้ซ้ำ แทนที่จะใช้เหตุผลตั้งแต่ต้นทุกครั้ง ซึ่งลดทั้งต้นทุนและอัตราความผิดพลาด

การใช้งานจริงในโลกแห่งความเป็นจริง

เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน

ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง

เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มพล็อต' และผู้ดำเนินการที่รันการดำเนินการของแพนด้าแต่ละตัวตามลำดับ

เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละครั้ง

รูปแบบการดำเนินงาน

ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ

เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน

เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ

ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง

ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ

เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มพล็อต' และผู้ดำเนินการที่รันการดำเนินการของแพนด้าแต่ละตัวตามลำดับ

เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มของพล็อต' และผู้ดำเนินการที่ดำเนินการดำเนินการของแพนด้าแต่ละครั้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ

เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละครั้ง

เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละทีมมักจะได้รับผลลัพธ์ที่ดีกว่า เมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้

!

ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก

!

คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง

แผนงานการดำเนินงาน

1

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป