Hướng dẫn tác nhân phản xạ và tự điều chỉnh

Tổng quan

Phản ánh là một kỹ thuật trong đó tác nhân AI phản ánh bằng văn bản về những thất bại của chính mình và đưa những bài học đó vào lần thử tiếp theo. Nó quan trọng vì nó cho phép các tác nhân cải thiện nhiệm vụ mà không cần đào tạo lại mô hình cơ bản.

Tác nhân phản xạ và tự sửa lỗi tập trung vào việc triển khai thực tế: biến khả năng của mô hình thành quy trình công việc hàng ngày đáng tin cậy mang lại giá trị có thể đo lường được.

Lặn sâu

Phản xạ, được Shinn và các đồng nghiệp giới thiệu trong một bài báo năm 2023, cung cấp cho tác nhân một vòng lặp: nó thực hiện một nhiệm vụ, nhận tín hiệu về cách thực hiện (kết quả kiểm tra, phần thưởng hoặc bài phê bình), sau đó viết một 'phản ánh' bằng ngôn ngữ tự nhiên ngắn giải thích điều gì đã xảy ra và điều gì cần thử tiếp theo. Sự phản ánh đó được lưu trữ trong bộ nhớ và thêm vào lời nhắc của lần thử tiếp theo. Điều quan trọng là trọng lượng của mô hình không bao giờ thay đổi; quá trình học tập diễn ra hoàn toàn trong cửa sổ ngữ cảnh dưới dạng văn bản. 'Học tăng cường bằng lời nói' này cho phép các nhân viên lặp lại các vấn đề về mã hóa, điều hướng trang web và các nhiệm vụ lý luận. Trên điểm chuẩn mã hóa HumanEval, khả năng tự sửa lỗi theo kiểu Reflexion đã đẩy tỷ lệ vượt qua cao hơn đáng kể so với các lần thử bắn một lần, chỉ bằng cách cho phép tác nhân tự sửa lỗi sau một vài lần thử.

Hiểu biết kỹ thuật

Phản xạ phân chia ba vai trò: Tác nhân tạo ra hành động, Người đánh giá cho điểm kết quả (kiểm tra đơn vị, kiểm tra đối sánh chính xác hoặc giám khảo LLM) và mô hình Tự phản ánh biến điểm đó thành một bài học văn bản. Bài học nằm trong vùng đệm bộ nhớ theo từng giai đoạn được sử dụng lại trong lần thử tiếp theo. Vì phản hồi là ngôn ngữ chứ không phải độ dốc nên không cần đào tạo GPU mà phụ thuộc rất nhiều vào tín hiệu đánh giá đáng tin cậy để tránh củng cố những phản ánh tự tin nhưng sai lầm.

Làm chủ phản xạ và các tác nhân tự sửa lỗi

Để xây dựng sự hiểu biết sâu sắc, hãy coi Tác nhân Phản xạ và Tự sửa lỗi như một mô hình hoạt động chứ không phải một tính năng đơn lẻ. Xác định các kết quả mong muốn, làm rõ các giả định và tách biệt những gì hệ thống có thể thực hiện một cách đáng tin cậy với những gì vẫn cần đến sự đánh giá của chuyên gia.

Trong thực tế, các nhóm mạnh sử dụng Tác nhân phản xạ và tự sửa lỗi tập trung vào kết quả của quy trình làm việc chứ không phải các bản trình diễn mô hình và xác định sớm các điểm kiểm tra của con người. Họ ghi lại các tiêu chí thành công rõ ràng, kiểm tra dựa trên dữ liệu và quy trình làm việc thực tế, đồng thời lặp lại dựa trên các kiểu thất bại được quan sát thay vì chiến thắng điểm chuẩn một lần. Đây là nơi sự hiểu biết về mặt lý thuyết biến thành khả năng bền vững trên toàn bộ sản phẩm, chính sách và hoạt động.

Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không. Đồng thời, Tự động hóa một quy trình bị hỏng có thể khuếch đại các vấn đề hiện có. Cách tiếp cận linh hoạt nhất là kết hợp tốc độ thử nghiệm với kỷ luật quản trị: chạy thử nghiệm, thu thập bằng chứng, xuất bản nhật ký quyết định và liên tục cập nhật các biện pháp bảo vệ khi hành vi của mô hình, kỳ vọng của người dùng và các yêu cầu pháp lý phát triển.

Tác động chiến lược

Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không.

Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Tích hợp quy trình làm việc tốt sẽ giúp tăng năng suất mà người dùng có thể tin tưởng.

Tích hợp quy trình làm việc tốt sẽ giúp tăng năng suất mà người dùng có thể tin tưởng. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Các trường hợp sử dụng có phạm vi phù hợp giúp giảm bớt sự mệt mỏi khi thay đổi và rủi ro triển khai.

Các trường hợp sử dụng có phạm vi phù hợp giúp giảm bớt sự mệt mỏi khi thay đổi và rủi ro triển khai. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Tương lai của các Tác nhân Phản xạ và Tự sửa lỗi

Tự sửa lỗi đang trở thành một lớp mặc định trong khung tác nhân chứ không phải là một thủ thuật nghiên cứu. Mong đợi sự tích hợp chặt chẽ hơn với các trình xác minh tự động, chẳng hạn như hộp cát mã, trình kiểm tra chính thức và truy xuất để xác nhận sự thật, do đó, phản ánh dựa trên các tín hiệu khách quan thay vì tự đoán lần thứ hai của mô hình. Những thách thức mở là tránh các vòng lặp trong đó tác nhân liên tục 'sửa chữa' đầu ra hoạt động, quyết định thời điểm dừng lặp lại và ngăn các phản ánh trôi vào những cách hợp lý hóa nghe có vẻ hợp lý nhưng chưa được xác minh.

Triển khai trong thế giới thực

Một tác nhân mã hóa chạy các bài kiểm tra đơn vị, đọc xác nhận lỗi, viết ghi chú về lỗi và chỉnh sửa mã của nó trước khi chạy lại bộ phần mềm.

Một trợ lý nghiên cứu nhận ra một trích dẫn ảo giác khi quá trình kiểm tra truy xuất không thành công, sau đó sửa lại câu trả lời để chỉ sử dụng các nguồn đã được xác minh.

Một tác nhân điều hướng web (ví dụ: trên điểm chuẩn AlfWorld hoặc WebShop) ghi lại 'Tôi đã nhấp sai bộ lọc' và tránh sai sót đó khi thử lại.

Người giải toán sẽ kiểm tra câu trả lời cuối cùng dựa trên một ràng buộc, nhận thấy lỗi dấu và thực hiện lại bước liên quan.

Các mẫu triển khai

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Một tác nhân mã hóa chạy các bài kiểm tra đơn vị, đọc xác nhận lỗi, viết ghi chú về lỗi và chỉnh sửa mã của nó trước khi chạy lại bộ phần mềm.

Các nhóm thường nhận được kết quả tốt hơn khi họ xác định ngay từ đầu các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất cũng như chi phí do lỗi theo thời gian.

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Một trợ lý nghiên cứu nhận ra một trích dẫn ảo giác khi quá trình kiểm tra truy xuất không thành công, sau đó sửa lại câu trả lời để chỉ sử dụng các nguồn đã được xác minh.

Các nhóm thường nhận được kết quả tốt hơn khi họ xác định ngay từ đầu các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất cũng như chi phí do lỗi theo thời gian.

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Một tác nhân điều hướng web (ví dụ: trên điểm chuẩn AlfWorld hoặc WebShop) ghi lại 'Tôi đã nhấp sai bộ lọc' và tránh sai sót đó khi thử lại.

Các nhóm thường nhận được kết quả tốt hơn khi họ xác định ngay từ đầu các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất cũng như chi phí do lỗi theo thời gian.

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Người giải toán sẽ kiểm tra câu trả lời cuối cùng dựa trên một ràng buộc, nhận thấy lỗi dấu và thực hiện lại bước liên quan.

Các nhóm thường nhận được kết quả tốt hơn khi họ xác định ngay từ đầu các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất cũng như chi phí do lỗi theo thời gian.

Rủi ro & lan can

!

Tự động hóa một quy trình bị hỏng có thể khuếch đại các vấn đề hiện có.

!

Các nhóm có thể tự động hóa quá mức và loại bỏ sự phán xét cần thiết của con người.

!

Chất lượng có thể thay đổi nếu kết quả đầu ra không được đánh giá liên tục.

Lộ trình thực hiện

1

Lập sơ đồ quy trình làm việc hiện tại và xác định bước có mức độ ma sát cao nhất.

Hãy coi đây như một cổng bằng chứng: nếu không đáp ứng các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

2

Xác định các điểm kiểm tra của con người trước khi tự động hóa hoàn toàn.

Hãy coi đây như một cổng bằng chứng: nếu không đáp ứng các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

3

Đào tạo người dùng về lời nhắc, đường dẫn leo thang và tiêu chuẩn chất lượng.

Hãy coi đây như một cổng bằng chứng: nếu không đáp ứng các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

4

Theo dõi kết quả ở cấp độ nhiệm vụ để xác nhận giá trị bền vững.

Hãy coi đây như một cổng bằng chứng: nếu không đáp ứng các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

Tiếp tục khám phá

Trợ lý AI

Thiết kế quy trình làm việc của trợ lý luôn hữu ích và đáng tin cậy.

Đọc hướng dẫn

Mã hóa AI

Xem cách ứng dụng AI cải thiện việc phân phối phần mềm.

Đọc hướng dẫn

Tác nhân phản xạ và tự điều chỉnh

Tổng quan

Lặn sâu

Hiểu biết kỹ thuật

Làm chủ phản xạ và các tác nhân tự sửa lỗi

Tác động chiến lược

Tương lai của các Tác nhân Phản xạ và Tự sửa lỗi

Triển khai trong thế giới thực

Các mẫu triển khai

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Tác nhân phản xạ và tự điều chỉnh trong thực tế

Rủi ro & lan can

Lộ trình thực hiện

Tiếp tục khám phá

Trợ lý AI

Mã hóa AI

Related guides