HƯỚNG DẪN AI về ngôn ngữ

Cây Suy Nghĩ

Cây suy nghĩ (ToT) là một khung nhắc nhở cho phép mô hình ngôn ngữ khám phá song song nhiều đường dẫn lý luận, giống như các nhánh của cây, thay vì cam kết theo một dòng suy nghĩ duy nhất.

Tổng quan

Cây suy nghĩ (ToT) là một khung nhắc nhở cho phép mô hình ngôn ngữ khám phá song song nhiều đường dẫn lý luận, giống như các nhánh của cây, thay vì cam kết theo một dòng suy nghĩ duy nhất. Điều này quan trọng vì nó cải thiện đáng kể hiệu suất đối với các vấn đề yêu cầu lập kế hoạch, tìm kiếm hoặc quay lui.

Tree of Thoughts là một phần của ngăn xếp ngôn ngữ-AI được sử dụng để đọc, tạo, phân loại và chuyển đổi văn bản cũng như lời nói trên quy mô lớn.

Lặn sâu

Chuỗi suy nghĩ tiêu chuẩn sẽ hướng dẫn mô hình thực hiện một chuỗi các bước suy luận từ đầu đến cuối, hiệu quả cho nhiều nhiệm vụ nhưng không thành công khi một sai lầm ban đầu làm hỏng toàn bộ câu trả lời. Cây suy nghĩ, được giới thiệu bởi các nhà nghiên cứu tại Princeton và Google DeepMind vào năm 2023, điều chỉnh lại lý luận như một cuộc tìm kiếm trên một cái cây. Ở mỗi bước, mô hình tạo ra một số 'suy nghĩ' ứng viên (các bước trung gian hoặc giải pháp từng phần), đánh giá mức độ hứa hẹn của từng bước và sau đó khám phá thêm các nhánh tốt nhất, loại bỏ các ngõ cụt. Điều này cho phép mô hình nhìn về phía trước, so sánh các tùy chọn và quay lại, hoạt động giống như một người giải quyết vấn đề có chủ ý hơn là một người đoán một lần. Trong các nhiệm vụ như Trò chơi 24, ToT đã nâng tỷ lệ thành công từ vài phần trăm với chuỗi suy nghĩ lên khoảng 74%.

Hiểu biết kỹ thuật

ToT kết hợp ba thành phần: một công cụ tạo ý tưởng đề xuất nhiều bước tiếp theo, một công cụ đánh giá trạng thái cho điểm hoặc bỏ phiếu về khả năng thành công của mỗi đường dẫn từng phần và một thuật toán tìm kiếm, thường là tìm kiếm theo chiều rộng hoặc tìm kiếm theo chiều sâu, quyết định nhánh nào sẽ mở rộng hoặc cắt bớt. Bản thân mô hình thường thực hiện việc đánh giá bằng cách được nhắc xếp hạng các trạng thái là 'chắc chắn', 'có thể' hoặc 'không thể'. Điều quan trọng, đây là phần bao bọc xung quanh các lời nhắc của mô hình chứ không phải đào tạo lại.

Làm chủ cây suy nghĩ

Cây suy nghĩ (ToT) là một khung nhắc nhở cho phép mô hình ngôn ngữ khám phá song song nhiều đường dẫn lý luận, giống như các nhánh của cây, thay vì cam kết theo một dòng suy nghĩ duy nhất. Điều này quan trọng vì nó cải thiện đáng kể hiệu suất đối với các vấn đề yêu cầu lập kế hoạch, tìm kiếm hoặc quay lui. Tree of Thoughts là một phần của ngăn xếp ngôn ngữ-AI được sử dụng để đọc, tạo, phân loại và chuyển đổi văn bản cũng như lời nói trên quy mô lớn. Để xây dựng sự hiểu biết sâu sắc, hãy coi Tree of Thoughts như một mô hình vận hành chứ không phải một tính năng duy nhất: xác định kết quả mong muốn, làm rõ các giả định và tách biệt những gì hệ thống có thể thực hiện một cách đáng tin cậy với những gì vẫn cần đến sự đánh giá của chuyên gia.

Trong thực tế, các nhóm mạnh sử dụng Tree of Thoughts thiết kế các lời nhắc, truy xuất và vòng lặp xem xét như một hệ thống liên lạc tích hợp. Họ ghi lại các tiêu chí thành công rõ ràng, kiểm tra dựa trên dữ liệu và quy trình làm việc thực tế, đồng thời lặp lại dựa trên các kiểu thất bại được quan sát thay vì chiến thắng điểm chuẩn một lần. Đây là nơi sự hiểu biết về mặt lý thuyết biến thành khả năng bền vững trên toàn bộ sản phẩm, chính sách và hoạt động.

Quy trình công việc ngôn ngữ có thể di chuyển nhanh hơn mà không làm mất tính nhất quán. Đồng thời, các sự kiện ảo giác có thể âm thầm đưa vào các báo cáo, luồng hỗ trợ hoặc kết quả nghiên cứu. Cách tiếp cận linh hoạt nhất là kết hợp tốc độ thử nghiệm với kỷ luật quản trị: chạy thử nghiệm, thu thập bằng chứng, xuất bản nhật ký quyết định và liên tục cập nhật các biện pháp bảo vệ khi hành vi của mô hình, kỳ vọng của người dùng và các yêu cầu pháp lý phát triển.

Tác động chiến lược

Quy trình công việc ngôn ngữ có thể di chuyển nhanh hơn mà không làm mất tính nhất quán.

Quy trình công việc ngôn ngữ có thể di chuyển nhanh hơn mà không làm mất tính nhất quán. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Nó mở rộng quyền truy cập vào các ngôn ngữ và phong cách giao tiếp.

Nó mở rộng quyền truy cập vào các ngôn ngữ và phong cách giao tiếp. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Các nhóm có thể dành nhiều thời gian hơn để đánh giá trong khi quá trình tự động hóa xử lý sự lặp lại.

Các nhóm có thể dành nhiều thời gian hơn để đánh giá trong khi quá trình tự động hóa xử lý sự lặp lại. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.

Tương lai của cây tư tưởng

Mong đợi sự cân nhắc theo kiểu cây sẽ được đưa vào các hệ thống tác nhân và các mô hình 'lý luận' phân bổ tính toán bổ sung cho các vấn đề khó tại thời điểm suy luận. Các biến thể như Biểu đồ suy nghĩ cho phép các đường dẫn hợp nhất và sử dụng lại các kết quả trung gian, đồng thời những người đánh giá đã học có thể thay thế việc chấm điểm dựa trên lời nhắc để đảm bảo độ tin cậy. Xu hướng rộng hơn là coi việc tìm kiếm theo thời gian suy luận như một nút xoay có thể điều chỉnh được: dành nhiều điện toán hơn để khám phá các nhánh cho các câu hỏi có độ khó cao, ít hơn cho các câu hỏi dễ, làm mờ đi ranh giới giữa nhắc nhở và lập kế hoạch.

Triển khai trong thế giới thực

Giải câu đố Trò chơi 24, trong đó bốn số phải được kết hợp với số học để đạt đến 24, bằng cách khám phá và rút gọn nhiều phương trình ứng cử viên.

Nhiệm vụ viết sáng tạo trong đó mô hình phác thảo một số hướng cốt truyện, đánh giá tính mạch lạc và phát triển hướng mạnh nhất.

Chứng minh toán học hoặc các bài toán đố có nhiều bước trong đó việc quay lại một bước sai sót là điều cần thiết để đạt được câu trả lời đúng.

Các câu đố hạn chế như trò chơi ô chữ nhỏ, trong đó mô hình kiểm tra việc lấp đầy một phần và loại bỏ các nhánh vi phạm manh mối.

Các mẫu triển khai

Cây Tư Tưởng trong thực tế

Giải câu đố Trò chơi 24, trong đó bốn số phải được kết hợp với số học để đạt đến 24, bằng cách khám phá và rút gọn nhiều phương trình ứng cử viên.

Giải câu đố Trò chơi 24, trong đó bốn số phải được kết hợp với số học để đạt đến 24, bằng cách khám phá và rút gọn nhiều phương trình ứng cử viên. Các đội thường đạt được kết quả tốt hơn khi xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.

Cây Tư Tưởng trong thực tế

Nhiệm vụ viết sáng tạo trong đó mô hình phác thảo một số hướng cốt truyện, đánh giá tính mạch lạc và phát triển hướng mạnh nhất.

Nhiệm vụ viết sáng tạo trong đó mô hình phác thảo một số hướng cốt truyện, đánh giá tính mạch lạc và phát triển hướng mạnh nhất Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.

Cây Tư Tưởng trong thực tế

Chứng minh toán học hoặc các bài toán đố có nhiều bước trong đó việc quay lại một bước sai sót là điều cần thiết để đạt được câu trả lời đúng.

Bằng chứng toán học hoặc các bài toán đố gồm nhiều bước trong đó việc quay lại từ một bước sai sót là điều cần thiết để đạt được câu trả lời đúng. Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất cũng như chi phí do lỗi theo thời gian.

Cây Tư Tưởng trong thực tế

Các câu đố hạn chế như trò chơi ô chữ nhỏ, trong đó mô hình kiểm tra việc lấp đầy một phần và loại bỏ các nhánh vi phạm manh mối.

Các câu đố ràng buộc như trò chơi ô chữ nhỏ, trong đó mô hình kiểm tra việc lấp đầy một phần và loại bỏ các nhánh vi phạm manh mối. Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí do lỗi theo thời gian.

Rủi ro & lan can

!

Sự thật ảo giác có thể lặng lẽ đi vào báo cáo, luồng hỗ trợ hoặc kết quả nghiên cứu.

!

Sự nhạy cảm kịp thời có thể tạo ra kết quả không nhất quán đối với các yêu cầu tương tự.

!

Dữ liệu văn bản nhạy cảm có thể bị lộ nếu khả năng kiểm soát quyền truy cập yếu.

Lộ trình thực hiện

1

Xác định định dạng đầu ra, âm thanh và tiêu chuẩn chất lượng trước khi triển khai.

Xác định định dạng đầu ra, âm thanh và tiêu chuẩn chất lượng trước khi triển khai. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

2

Phản hồi mặt đất với các nguồn đáng tin cậy bất cứ khi nào độ chính xác quan trọng.

Phản hồi mặt đất với các nguồn đáng tin cậy bất cứ khi nào độ chính xác quan trọng. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

3

Duy trì điểm kiểm tra đánh giá của con người đối với các kết quả đầu ra có mức độ rủi ro cao.

Duy trì điểm kiểm tra đánh giá của con người đối với các kết quả đầu ra có mức độ rủi ro cao. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

4

Theo dõi các kiểu lỗi và đào tạo lại các lời nhắc hoặc quy trình làm việc thường xuyên.

Theo dõi các kiểu lỗi và đào tạo lại các lời nhắc hoặc quy trình làm việc thường xuyên. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.

Tiếp tục khám phá