คู่มือแอปพลิเคชัน

ตัวแทน RAG

Agentic RAG อัปเกรดรุ่นที่ดึงข้อมูล-เพิ่มแบบธรรมดาโดยให้ตัวแทนตัดสินใจว่าจะค้นหาเมื่อใด อะไร และกี่ครั้งก่อนที่จะตอบ

ภาพรวม

Agentic RAG อัปเกรดรุ่นที่ดึงข้อมูล-เพิ่มแบบธรรมดาโดยให้ตัวแทนตัดสินใจว่าจะค้นหาเมื่อใด อะไร และกี่ครั้งก่อนที่จะตอบ แทนที่จะใช้การค้นหาแบบตายตัวเพียงครั้งเดียว ระบบจะให้เหตุผล ดึงข้อมูล และปรับแต่งในลูป

Agentic RAG มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้

เจาะลึก

Classic recovery-augmented generation (RAG) ทำสิ่งหนึ่ง: รับคำถามของผู้ใช้ ดึงเอกสารที่เกี่ยวข้องสองสามรายการจากร้านค้าเวกเตอร์ และบรรจุลงในพร้อมท์ Agentic RAG ทำการตัดสินใจในการดึงข้อมูล อันดับแรกตัวแทนให้เหตุผลว่าจำเป็นต้องค้นหาหรือไม่ จะใช้การสืบค้นใด และแหล่งที่มาใดที่จะสืบค้น โดยสามารถแบ่งคำถามยากๆ ออกเป็นคำถามย่อย เรียกดูแต่ละข้อ ประเมินว่าผลลัพธ์เพียงพอหรือไม่ และค้นหาอีกครั้งด้วยคำค้นหาที่ได้รับการปรับปรุง หากไม่เป็นเช่นนั้น อาจกำหนดเส้นทางระหว่างฐานความรู้หลายแห่ง เรียกการค้นหาเว็บ หรือใช้ฐานข้อมูล SQL ขึ้นอยู่กับคำถาม พฤติกรรมการเลือกเครื่องมือซ้ำๆ นี้จัดการกับคำถามแบบมัลติฮอป ('ลูกค้ารายใดของเราในเท็กซัสที่ลงทะเบียนหลังจากการเปลี่ยนแปลงนโยบาย') RAG แบบช็อตเดียวนั้นตอบได้ไม่ดี โดยต้องเสียค่าใช้จ่ายในการเรียกโมเดลและเวลาแฝงที่มากขึ้น

ข้อมูลเชิงลึกทางเทคนิค

ตัวแทนปฏิบัติต่อรีทรีฟเวอร์เป็นเครื่องมือ ในแต่ละเทิร์น สามารถเลือกการดำเนินการดึงข้อมูล ตรวจสอบชิ้นส่วนที่ส่งคืน ตัดสินความเกี่ยวข้อง และตัดสินใจตอบหรือสอบถามอีกครั้งด้วยคำขอที่จัดรูปแบบใหม่ การวนซ้ำที่มีเงื่อนไขการหยุด (หลักฐานเพียงพอ หรือการจำกัดขั้นตอน) จะควบคุมการวนซ้ำ การออกแบบบางอย่างเพิ่มขั้นตอนการให้คะแนนซึ่งจะกรองส่วนที่ดึงข้อมูลที่ไม่เกี่ยวข้องออกก่อนการสร้าง ช่วยลดโอกาสที่แบบจำลองจะถูกเข้าใจผิดโดยบริบทนอกหัวข้อ

การเรียนรู้ Agentic RAG

Agentic RAG อัปเกรดรุ่นที่ดึงข้อมูล-เพิ่มแบบธรรมดาโดยให้ตัวแทนตัดสินใจว่าจะค้นหาเมื่อใด อะไร และกี่ครั้งก่อนที่จะตอบ แทนที่จะใช้การค้นหาแบบตายตัวเพียงครั้งเดียว ระบบจะให้เหตุผล ดึงข้อมูล และปรับแต่งในลูป Agentic RAG มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Agentic RAG เป็นแบบจำลองการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Agentic RAG จะมุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ Agentic RAG

Agentic RAG กำลังมาบรรจบกับเฟรมเวิร์กเอเจนต์ที่กว้างขึ้น การดึงข้อมูลกลายเป็นเครื่องมือหนึ่งในหลาย ๆ ควบคู่ไปกับเครื่องคิดเลข การเรียกใช้โค้ด และ API คาดหวังการวางแผนสืบค้นที่ชาญฉลาดยิ่งขึ้น การจัดระดับหลักฐานที่ดึงมาด้วยตนเอง และการแคชการสืบค้นในอดีตเพื่อลดต้นทุน การกำหนดเส้นทางต้นทางที่ดีขึ้นจะช่วยให้ตัวแทนคนหนึ่งดึงข้อมูลจากเอกสารภายใน เว็บ และฐานข้อมูลที่มีโครงสร้างด้วยคำตอบเดียว ความตึงเครียดหลัก ความแม่นยำ เทียบกับเวลาแฝง และค่าใช้จ่าย จะขับเคลื่อนระบบที่ปรับเปลี่ยนได้ซึ่งใช้การดึงข้อมูลหลายขั้นตอนจำนวนมากเฉพาะเมื่อคำถามรับประกันได้จริงเท่านั้น

การใช้งานจริงในโลกแห่งความเป็นจริง

ผู้ช่วยระดับองค์กรที่ตัดสินใจว่าจะสืบค้นคู่มือ HR, Codebase Wiki หรือฐานข้อมูลการขาย SQL ตามคำถาม

ผู้ช่วยวิจัยที่แยก 'เปรียบเทียบผลข้างเคียงของยา A และยา B' ออกเป็น 2 การค้นหา จากนั้นดึงข้อมูลแต่ละรายการ แล้วสังเคราะห์

บอทสนับสนุนที่ดึงเอกสาร ตัดสินว่าเอกสารไม่เพียงพอ จัดรูปแบบแบบสอบถามใหม่ และค้นหาอีกครั้งก่อนตอบกลับ

เครื่องมือทางกฎหมายที่ดำเนินการดึงข้อมูลแบบมัลติฮอป ค้นหาส่วนคำสั่ง จากนั้นค้นหาข้อกำหนดที่อ้างอิง

รูปแบบการดำเนินงาน

Agentic RAG ในทางปฏิบัติ

ผู้ช่วยระดับองค์กรที่ตัดสินใจว่าจะสืบค้นคู่มือ HR, Codebase Wiki หรือฐานข้อมูลการขาย SQL ตามคำถาม

ผู้ช่วยระดับองค์กรที่ตัดสินใจว่าจะสอบถามคู่มือ HR, วิกิฐานข้อมูลโค้ด หรือฐานข้อมูลการขาย SQL โดยอิงตามคำถาม ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

ผู้ช่วยวิจัยที่แยก 'เปรียบเทียบผลข้างเคียงของยา A และยา B' ออกเป็น 2 การค้นหา จากนั้นดึงข้อมูลแต่ละรายการ แล้วสังเคราะห์

ผู้ช่วยวิจัยที่แยก 'เปรียบเทียบผลข้างเคียงของยา A และยา B' ออกเป็นสองการค้นหา จากนั้นดึงข้อมูลสำหรับแต่ละทีม จากนั้นสังเคราะห์ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้น เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

บอทสนับสนุนที่ดึงเอกสาร ตัดสินว่าเอกสารไม่เพียงพอ จัดรูปแบบแบบสอบถามใหม่ และค้นหาอีกครั้งก่อนตอบกลับ

บอทสนับสนุนที่เรียกเอกสาร ตัดสินว่าไม่เพียงพอ จัดรูปแบบแบบสอบถามใหม่ และค้นหาอีกครั้งก่อนที่จะตอบกลับ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

เครื่องมือทางกฎหมายที่ดำเนินการดึงข้อมูลแบบมัลติฮอป ค้นหาส่วนคำสั่ง จากนั้นค้นหาข้อกำหนดที่อ้างอิง

เครื่องมือทางกฎหมายที่ดำเนินการดึงข้อมูลแบบมัลติฮอป ค้นหาคำสั่ง จากนั้นค้นหากฎระเบียบที่อ้างอิงถึง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้

!

ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก

!

คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง

แผนงานการดำเนินงาน

1

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป