คู่มือทางเทคนิค

Toolformer และการใช้เครื่องมือที่เรียนรู้ด้วยตนเอง

Toolformer คือวิธีการ Meta AI ปี 2023 ที่ให้โมเดลภาษาสอนตัวเองว่าจะเรียกเครื่องมือภายนอกเมื่อใดและอย่างไร เช่น เครื่องคิดเลข เครื่องมือค้นหา และนักแปล

ภาพรวม

Toolformer คือวิธีการ Meta AI ปี 2023 ที่ให้โมเดลภาษาสอนตัวเองว่าจะเรียกเครื่องมือภายนอกเมื่อใดและอย่างไร เช่น เครื่องคิดเลข เครื่องมือค้นหา และนักแปล แทนที่จะให้มนุษย์ติดป้ายกำกับการเรียกใช้เครื่องมือ โมเดลจะสร้างและกรองตัวอย่างการฝึกของตัวเอง จากนั้นจึงปรับแต่งตัวอย่างที่ช่วยได้จริง

Toolformer และการใช้เครื่องมือที่เรียนรู้ด้วยตนเองเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

Toolformer จาก Schick และคณะ ที่ Meta AI จัดการกับความขัดแย้ง: โมเดลขนาดใหญ่เก่งภาษาแต่ไม่เก่งเลขคณิต ข้อเท็จจริงใหม่ๆ และการค้นหาที่แม่นยำ วงจรการฝึกอบรมมีการดูแลตนเอง โมเดลนี้ได้รับตัวอย่างที่เขียนโดยมนุษย์จำนวนหนึ่งซึ่งแสดงไวยากรณ์การเรียก API จากนั้นได้รับแจ้งให้แทรกการเรียกของผู้สมัคร (ห่อด้วยโทเค็นพิเศษ) ในหลายตำแหน่งทั่วทั้งคลังข้อความขนาดใหญ่ การเรียกผู้สมัครแต่ละครั้งได้รับการดำเนินการจริง และผลลัพธ์จะถูกเชื่อมต่อเข้าด้วยกัน ขั้นตอนการกรองคีย์จะคงการเรียกเครื่องมือไว้ก็ต่อเมื่อการมีผล API ช่วยลดความซับซ้อนของโมเดลในข้อความจริงที่กำลังจะมาถึงมากกว่าการไม่โทรหรือการโทรที่แตกต่างออกไป จากนั้นโมเดลจะได้รับการปรับแต่งอย่างละเอียดบนชุดข้อมูลที่กรองและสร้างขึ้นเองนี้ โดยเรียนรู้ที่จะเรียกใช้เครื่องมือ 5 ชนิด ได้แก่ เครื่องคิดเลข ระบบ QA เครื่องมือค้นหา นักแปล และปฏิทิน

ข้อมูลเชิงลึกทางเทคนิค

แนวคิดที่เด็ดขาดคือวัตถุประสงค์ในการกรองแบบควบคุมตนเอง สำหรับแต่ละตำแหน่งผู้สมัคร Toolformer จะเปรียบเทียบการสูญเสียของการทำนายโทเค็นต่อไปนี้กับผลลัพธ์ API ที่แทรกไว้กับที่ไม่มีการแทรก การโทรที่ลดการสูญเสียมากกว่าเกณฑ์จะยังคงอยู่ สายที่ไร้ประโยชน์หรือมีเสียงดังจะถูกทิ้งไป ซึ่งหมายความว่าไม่จำเป็นต้องมีคำอธิบายประกอบโดยมนุษย์เกี่ยวกับการใช้เครื่องมือ 'ถูกต้อง' โมเดลจะตัดสินว่าการเรียกใดให้ข้อมูลอย่างแท้จริง และเรียนรู้ตำแหน่งและข้อโต้แย้งร่วมกัน

การเรียนรู้ Toolformer และการใช้เครื่องมือที่เรียนรู้ด้วยตนเอง

Toolformer คือวิธีการ Meta AI ปี 2023 ที่ให้โมเดลภาษาสอนตัวเองว่าจะเรียกเครื่องมือภายนอกเมื่อใดและอย่างไร เช่น เครื่องคิดเลข เครื่องมือค้นหา และนักแปล แทนที่จะให้มนุษย์ติดป้ายกำกับการเรียกใช้เครื่องมือ โมเดลจะสร้างและกรองตัวอย่างการฝึกของตัวเอง จากนั้นจึงปรับแต่งตัวอย่างที่ช่วยได้จริง Toolformer และการใช้เครื่องมือที่เรียนรู้ด้วยตนเองเป็นองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Toolformer และ Self-Taught Tool Use เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Toolformer และเครื่องมือที่เรียนรู้ด้วยตนเอง ใช้สถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานที่ปรับให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ Toolformer และการใช้เครื่องมือที่เรียนรู้ด้วยตนเอง

Toolformer เป็นผู้ริเริ่มการใช้เครื่องมือและการเรียกใช้ฟังก์ชันในปัจจุบัน ขอบเขตกำลังย้ายจากเครื่องมือคงที่จำนวนหนึ่งไปเป็นหลายสิบหรือหลายร้อยที่พบในรันไทม์ โดยมีโมเดลต่างๆ คอยให้เหตุผลว่าเครื่องมือใดที่จะเรียกใช้ การโทรแบบผูกมัด และการจัดการความล้มเหลว คาดหวังการผสานรวมที่เข้มงวดยิ่งขึ้นกับการเรียนรู้แบบเสริมกำลังและลูปของตัวแทน รวมถึงการเรียนรู้แบบทันทีทันใดของ API ใหม่ เพื่อให้การใช้เครื่องมือที่เรียนรู้ด้วยตนเองกลายเป็นความสามารถมาตรฐานมากกว่าการปรับแต่งแบบเฉพาะทาง

การใช้งานจริงในโลกแห่งความเป็นจริง

การเรียกเครื่องคิดเลข API ประโยคกลางเพื่อรับเลขคณิตที่แน่นอนแทนที่จะเดาคำตอบที่เป็นตัวเลข

การสอบถามการค้นหาหรือระบบประกันคุณภาพเพื่อดึงข้อมูลที่เป็นปัจจุบันหรือข้อเท็จจริงที่ไม่ค่อยพบเห็น

การเรียกใช้เครื่องมือแปลด้วยเครื่องเพื่อแสดงวลีในภาษาอื่นภายในข้อความที่สร้างขึ้น

การใช้เครื่องมือปฏิทิน/วันที่เพื่อแก้ไขการอ้างอิงที่เกี่ยวข้อง เช่น 'วันศุกร์หน้า' กับวันที่ที่เป็นรูปธรรม

รูปแบบการดำเนินงาน

Toolformer และ Self-Taught Tool การใช้ในทางปฏิบัติ

การเรียกเครื่องคิดเลข API ประโยคกลางเพื่อรับเลขคณิตที่แน่นอนแทนที่จะเดาคำตอบที่เป็นตัวเลข

การเรียกเครื่องคิดเลข API ประโยคกลางเพื่อรับเลขคณิตที่แน่นอนแทนที่จะเดาคำตอบที่เป็นตัวเลข ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Toolformer และ Self-Taught Tool การใช้ในทางปฏิบัติ

การสอบถามการค้นหาหรือระบบประกันคุณภาพเพื่อดึงข้อมูลที่เป็นปัจจุบันหรือข้อเท็จจริงที่ไม่ค่อยพบเห็น

การสอบถามการค้นหาหรือระบบ QA เพื่อดึงข้อมูลที่เป็นปัจจุบันหรือข้อเท็จจริงที่ไม่ค่อยพบเห็น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Toolformer และ Self-Taught Tool การใช้ในทางปฏิบัติ

การเรียกใช้เครื่องมือแปลด้วยเครื่องเพื่อแสดงวลีในภาษาอื่นภายในข้อความที่สร้างขึ้น

การเรียกใช้เครื่องมือการแปลด้วยเครื่องเพื่อเรนเดอร์วลีในภาษาอื่นภายในข้อความที่สร้างขึ้น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

Toolformer และ Self-Taught Tool การใช้ในทางปฏิบัติ

การใช้เครื่องมือปฏิทิน/วันที่เพื่อแก้ไขการอ้างอิงที่เกี่ยวข้อง เช่น 'วันศุกร์หน้า' กับวันที่ที่เป็นรูปธรรม

การใช้เครื่องมือปฏิทิน/วันที่เพื่อแก้ไขการอ้างอิงที่เกี่ยวข้อง เช่น 'วันศุกร์หน้า' กับวันที่ที่เป็นรูปธรรม ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป