ภาพรวม
ตัวแทนผู้วางแผนและผู้บริหารแบ่งระบบ AI ออกเป็นสองบทบาท ได้แก่ ผู้วางแผนที่แบ่งเป้าหมายออกเป็นขั้นตอน และผู้ดำเนินการที่ดำเนินการแต่ละขั้นตอน การแยกนี้ทำให้งานที่ซับซ้อนและหลายขั้นตอนมีความน่าเชื่อถือมากขึ้นและแก้ไขจุดบกพร่องได้ง่ายขึ้น
Planner-Executor Agents มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้
เจาะลึก
ตัวแทนผู้วางแผนและผู้บริหารแบ่งงานระหว่างการคิดและการทำ ผู้วางแผนตั้งเป้าหมายระดับสูง เช่น 'จองการเดินทางไปโตเกียวในราคาต่ำกว่า 2,000 ดอลลาร์' และแยกย่อยเป็นรายการงานย่อยตามลำดับ เช่น ค้นหาเที่ยวบิน เปรียบเทียบโรงแรม ตรวจสอบงบประมาณ ยืนยันการจอง จากนั้นผู้ดำเนินการจะจัดการงานย่อยแต่ละงาน โดยมักจะเรียกเครื่องมือ, API หรือโมเดลอื่นๆ สิ่งสำคัญที่สุดคือ การควบคุมจะวนกลับ: หลังจากที่ผู้ดำเนินการส่งคืนผลลัพธ์ ผู้วางแผนสามารถวางแผนใหม่ได้หากมีบางอย่างล้มเหลวหรือมีข้อมูลใหม่ปรากฏขึ้น บางครั้งเรียกว่ารูปแบบการวางแผนและแก้ไขหรือแบบลำดับชั้น การแบ่งบทบาทช่วยได้เนื่องจากโมเดลเดี่ยวที่พยายามวางแผนและดำเนินการในคราวเดียวมีแนวโน้มที่จะสูญเสียการติดตามเป้าหมาย ข้ามขั้นตอน หรือทำให้เกิดภาพหลอนความคืบหน้า การแยกพวกมันออกจากกันทำให้เจตนาระดับสูงคงที่ในขณะที่ผู้ดำเนินการโฟกัสอย่างแคบ
ข้อมูลเชิงลึกทางเทคนิค
โดยทั่วไปแล้ว อินสแตนซ์โมเดลหนึ่ง (หรือพร้อมต์) มีไว้สำหรับการวางแผนและสร้างรายการขั้นตอนที่มีโครงสร้าง ในขณะที่อินสแตนซ์ตัวดำเนินการที่แยกต่างหากจะรันแต่ละขั้นตอนด้วยการเข้าถึงเครื่องมือ สถานะ เช่น ขั้นตอนที่เสร็จสมบูรณ์และเอาต์พุตระดับกลาง จะถูกส่งกลับไปยังผู้วางแผนผ่านหน้าต่างบริบทหรือหน่วยความจำภายนอก การใช้งานหลายอย่างแทรกการวางแผนและการดำเนินการแบบวนซ้ำ (การวางแผนใหม่) แทนที่จะยอมรับแผนคงที่แผนเดียว ซึ่งจัดการกับข้อผิดพลาดและการเปลี่ยนแปลงเงื่อนไขอย่างสวยงาม
เชี่ยวชาญตัวแทนผู้วางแผน-ผู้ดำเนินการ
ตัวแทนผู้วางแผนและผู้บริหารแบ่งระบบ AI ออกเป็นสองบทบาท ได้แก่ ผู้วางแผนที่แบ่งเป้าหมายออกเป็นขั้นตอน และผู้ดำเนินการที่ดำเนินการแต่ละขั้นตอน การแยกนี้ทำให้งานที่ซับซ้อนและหลายขั้นตอนมีความน่าเชื่อถือมากขึ้นและแก้ไขจุดบกพร่องได้ง่ายขึ้น Planner-Executor Agents มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Planner-Executor Agent เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ
ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ตัวแทนการวางแผน-ผู้บริหารมุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน
การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง
ผลกระทบเชิงกลยุทธ์
การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่
การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้
การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ
กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ
การใช้งานจริงในโลกแห่งความเป็นจริง
เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน
ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง
เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มพล็อต' และผู้ดำเนินการที่รันการดำเนินการของแพนด้าแต่ละตัวตามลำดับ
เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละครั้ง
รูปแบบการดำเนินงาน
ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ
เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน
เอเจนต์การเขียนโค้ดที่ผู้วางแผนสรุป 'ฟังก์ชันการเขียน เพิ่มการทดสอบ รันชุดโปรแกรม แก้ไขความล้มเหลว' และผู้ดำเนินการแก้ไขไฟล์ และรันคำสั่งทดสอบสำหรับแต่ละขั้นตอน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ
ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง
ผู้ช่วยจองการเดินทางที่วางแผนการค้นหาเที่ยวบิน การเปรียบเทียบโรงแรม และการตรวจสอบงบประมาณ จากนั้นดำเนินการแต่ละรายการโดยสอบถาม API การจอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ
เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มพล็อต' และผู้ดำเนินการที่รันการดำเนินการของแพนด้าแต่ละตัวตามลำดับ
เอเจนต์การวิเคราะห์ข้อมูลที่วางแผน 'โหลด CSV, ล้างค่าว่าง, สรุปการคำนวณ, แนวโน้มของพล็อต' และผู้ดำเนินการที่ดำเนินการดำเนินการของแพนด้าแต่ละครั้ง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ตัวแทนผู้วางแผนและผู้บริหารในทางปฏิบัติ
เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละครั้ง
เวิร์กโฟลว์การสนับสนุนลูกค้าที่ผู้วางแผนตัดสินใจว่าการค้นหาฐานความรู้และการดำเนินการบัญชีใดที่จำเป็น และผู้ดำเนินการดำเนินการโทรแต่ละทีมมักจะได้รับผลลัพธ์ที่ดีกว่า เมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป
ความเสี่ยงและรั้ว
การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้
ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก
คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง
แผนงานการดำเนินงาน
แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด
แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ
กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ
ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น
ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน
ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น