คู่มือ RAG ตัวแทน

ภาพรวม

Agentic RAG อัปเกรดรุ่นที่ดึงข้อมูล-เพิ่มแบบธรรมดาโดยให้ตัวแทนตัดสินใจว่าจะค้นหาเมื่อใด อะไร และกี่ครั้งก่อนที่จะตอบ แทนที่จะใช้การค้นหาแบบตายตัวเพียงครั้งเดียว ระบบจะให้เหตุผล ดึงข้อมูล และปรับแต่งในลูป

Agentic RAG มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นเวิร์กโฟลว์รายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้

เจาะลึก

Classic recovery-augmented generation (RAG) ทำสิ่งหนึ่ง: รับคำถามของผู้ใช้ ดึงเอกสารที่เกี่ยวข้องสองสามรายการจากร้านค้าเวกเตอร์ และบรรจุลงในพร้อมท์ Agentic RAG ทำการตัดสินใจในการดึงข้อมูล อันดับแรกตัวแทนให้เหตุผลว่าจำเป็นต้องค้นหาหรือไม่ จะใช้การสืบค้นใด และแหล่งที่มาใดที่จะสืบค้น โดยสามารถแบ่งคำถามยากๆ ออกเป็นคำถามย่อย เรียกดูแต่ละข้อ ประเมินว่าผลลัพธ์เพียงพอหรือไม่ และค้นหาอีกครั้งด้วยคำค้นหาที่ได้รับการปรับปรุง หากไม่เป็นเช่นนั้น อาจกำหนดเส้นทางระหว่างฐานความรู้หลายแห่ง เรียกการค้นหาเว็บ หรือใช้ฐานข้อมูล SQL ขึ้นอยู่กับคำถาม พฤติกรรมการเลือกเครื่องมือซ้ำๆ นี้จัดการกับคำถามแบบมัลติฮอป ('ลูกค้ารายใดของเราในเท็กซัสที่ลงทะเบียนหลังจากการเปลี่ยนแปลงนโยบาย') RAG แบบช็อตเดียวนั้นตอบได้ไม่ดี โดยต้องเสียค่าใช้จ่ายในการเรียกโมเดลและเวลาแฝงที่มากขึ้น

ข้อมูลเชิงลึกทางเทคนิค

ตัวแทนปฏิบัติต่อรีทรีฟเวอร์เป็นเครื่องมือ ในแต่ละเทิร์น สามารถเลือกการดำเนินการดึงข้อมูล ตรวจสอบชิ้นส่วนที่ส่งคืน ตัดสินความเกี่ยวข้อง และตัดสินใจตอบหรือสอบถามอีกครั้งด้วยคำขอที่จัดรูปแบบใหม่ การวนซ้ำที่มีเงื่อนไขการหยุด (หลักฐานเพียงพอ หรือการจำกัดขั้นตอน) จะควบคุมการวนซ้ำ การออกแบบบางอย่างเพิ่มขั้นตอนการให้คะแนนซึ่งจะกรองส่วนที่ดึงข้อมูลที่ไม่เกี่ยวข้องออกก่อนการสร้าง ช่วยลดโอกาสที่แบบจำลองจะถูกเข้าใจผิดโดยบริบทนอกหัวข้อ

การเรียนรู้ Agentic RAG

หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Agentic RAG เป็นเพียงโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Agentic RAG จะมุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ Agentic RAG

Agentic RAG กำลังมาบรรจบกับเฟรมเวิร์กเอเจนต์ที่กว้างขึ้น การดึงข้อมูลกลายเป็นเครื่องมือหนึ่งในหลาย ๆ ควบคู่ไปกับเครื่องคิดเลข การเรียกใช้โค้ด และ API คาดหวังการวางแผนสืบค้นที่ชาญฉลาดยิ่งขึ้น การจัดระดับหลักฐานที่ดึงมาด้วยตนเอง และการแคชการสืบค้นในอดีตเพื่อลดต้นทุน การกำหนดเส้นทางต้นทางที่ดีขึ้นจะช่วยให้ตัวแทนคนหนึ่งดึงข้อมูลจากเอกสารภายใน เว็บ และฐานข้อมูลที่มีโครงสร้างด้วยคำตอบเดียว ความตึงเครียดหลัก ความแม่นยำ เทียบกับเวลาแฝง และค่าใช้จ่าย จะขับเคลื่อนระบบที่ปรับเปลี่ยนได้ซึ่งใช้การดึงข้อมูลหลายขั้นตอนจำนวนมากเฉพาะเมื่อคำถามรับประกันได้จริงเท่านั้น

การใช้งานจริงในโลกแห่งความเป็นจริง

ผู้ช่วยระดับองค์กรที่ตัดสินใจว่าจะสืบค้นคู่มือ HR, Codebase Wiki หรือฐานข้อมูลการขาย SQL ตามคำถาม

ผู้ช่วยวิจัยที่แยก 'เปรียบเทียบผลข้างเคียงของยา A และยา B' ออกเป็น 2 การค้นหา จากนั้นดึงข้อมูลแต่ละรายการ แล้วสังเคราะห์

บอทสนับสนุนที่ดึงเอกสาร ตัดสินว่าเอกสารไม่เพียงพอ จัดรูปแบบแบบสอบถามใหม่ และค้นหาอีกครั้งก่อนตอบกลับ

เครื่องมือทางกฎหมายที่ดำเนินการดึงข้อมูลแบบมัลติฮอป ค้นหาส่วนคำสั่ง จากนั้นค้นหาข้อกำหนดที่อ้างอิง

รูปแบบการดำเนินงาน

Agentic RAG ในทางปฏิบัติ

ผู้ช่วยระดับองค์กรที่ตัดสินใจว่าจะสืบค้นคู่มือ HR, Codebase Wiki หรือฐานข้อมูลการขาย SQL ตามคำถาม

โดยปกติทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

ผู้ช่วยวิจัยที่แยก 'เปรียบเทียบผลข้างเคียงของยา A และยา B' ออกเป็น 2 การค้นหา จากนั้นดึงข้อมูลแต่ละรายการ แล้วสังเคราะห์

โดยปกติทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

บอทสนับสนุนที่ดึงเอกสาร ตัดสินว่าเอกสารไม่เพียงพอ จัดรูปแบบแบบสอบถามใหม่ และค้นหาอีกครั้งก่อนตอบกลับ

โดยปกติทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Agentic RAG ในทางปฏิบัติ

เครื่องมือทางกฎหมายที่ดำเนินการดึงข้อมูลแบบมัลติฮอป ค้นหาส่วนคำสั่ง จากนั้นค้นหาข้อกำหนดที่อ้างอิง

โดยปกติทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้

!

ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก

!

คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง

แผนงานการดำเนินงาน

1

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด

ถือว่านี่เป็นประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ

ถือว่านี่เป็นประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ

ถือว่านี่เป็นประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน

ถือว่านี่เป็นประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป

ผู้ช่วย AI

ออกแบบเวิร์กโฟลว์ผู้ช่วยที่มีประโยชน์และเชื่อถือได้

อ่านคู่มือ

การเข้ารหัสเอไอ

ดูว่า AI ที่ประยุกต์ใช้ปรับปรุงการส่งมอบซอฟต์แวร์อย่างไร

อ่านคู่มือ

ตัวแทน RAG

ภาพรวม

เจาะลึก

ข้อมูลเชิงลึกทางเทคนิค

การเรียนรู้ Agentic RAG

ผลกระทบเชิงกลยุทธ์

อนาคตของ Agentic RAG

การใช้งานจริงในโลกแห่งความเป็นจริง

รูปแบบการดำเนินงาน

Agentic RAG ในทางปฏิบัติ

Agentic RAG ในทางปฏิบัติ

Agentic RAG ในทางปฏิบัติ

Agentic RAG ในทางปฏิบัติ

ความเสี่ยงและรั้ว

แผนงานการดำเนินงาน

สำรวจต่อไป

ผู้ช่วย AI

การเข้ารหัสเอไอ

Related guides