คู่มือ AI ภาษา

การปรับแต่งพร้อมท์

การปรับแต่งพร้อมท์จะปรับโมเดลภาษาที่แช่แข็งโดยการเรียนรู้เวกเตอร์ 'soft prompt' จำนวนหนึ่งอย่างต่อเนื่องซึ่งเติมไว้ข้างหน้าอินพุต แทนที่จะเขียนคำด้วยมือ

ภาพรวม

การปรับแต่งพร้อมท์จะปรับโมเดลภาษาที่แช่แข็งโดยการเรียนรู้เวกเตอร์ 'soft prompt' จำนวนหนึ่งอย่างต่อเนื่องซึ่งเติมไว้ข้างหน้าอินพุต แทนที่จะเขียนคำด้วยมือ มันเป็นหนึ่งในวิธีที่น้อยที่สุดในการสร้างโมเดลขนาดยักษ์โดยเฉพาะ และจะดีขึ้นเมื่อโมเดลมีขนาดใหญ่ขึ้น

Prompt Tuning เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด

เจาะลึก

การปรับแต่งคำนำหน้าซึ่งแนะนำโดยนักวิจัย Google Lester, Al-Rfou และ Constant ในปี 2021 เป็นการปรับแต่งคำนำหน้าที่ง่ายที่สุด แทนที่จะสร้างพรอมต์ข้อความด้วยตนเอง คุณจะหยุดทั้งโมเดลและเรียนรู้เมทริกซ์ขนาดเล็กของการฝังอย่างต่อเนื่อง—'ซอฟต์พรอมต์'—ที่เติมไว้ล่วงหน้าที่เลเยอร์อินพุตเท่านั้น การไล่ระดับสีจะปรับแต่งเวกเตอร์เหล่านี้เพื่อโน้มน้าวพฤติกรรมที่เหมาะสมสำหรับงาน การค้นพบที่น่าทึ่ง: เนื่องจากโมเดลพื้นฐานปรับขนาดตามพารามิเตอร์นับพันล้าน การปรับแต่งแบบทันทีจะปิดช่องว่างด้วยการปรับแต่งแบบละเอียดเต็มรูปแบบ และในที่สุดก็จะจับคู่กับการวัดประสิทธิภาพ เช่น SuperGLUE แต่ละงานต้องการเพียง soft prompt ของตัวเอง (ซึ่งมักมีพารามิเตอร์ไม่กี่พันพารามิเตอร์) ดังนั้นโมเดลที่แช่แข็งเพียงตัวเดียวจึงสามารถให้บริการได้หลายอย่างในคราวเดียว ผู้เขียนตีกรอบสิ่งนี้ว่าเป็น "พลังแห่งขนาดสำหรับการปรับแต่งพร้อมท์ที่มีประสิทธิภาพตามพารามิเตอร์"

ข้อมูลเชิงลึกทางเทคนิค

Soft Prompt ไม่ใช่คำจริง แต่เป็นเวกเตอร์ที่ลอยอย่างอิสระในพื้นที่ฝังซึ่งไม่จำเป็นต้องสอดคล้องกับโทเค็นใดๆ ในคำศัพท์ พวกมันจะถูกเพิ่มเฉพาะที่เลเยอร์การฝังอินพุตเท่านั้น (ต่างจากการปรับแต่งคำนำหน้าซึ่งแทรกเข้าไปในทุกเลเยอร์) ทำให้การปรับแต่งที่รวดเร็วยิ่งขึ้น เนื่องจากโมเดลถูกแช่แข็ง การไล่ระดับสีจึงไหลย้อนกลับไปยังการฝังแบบ soft-prompt เท่านั้น การเริ่มต้น ความยาวที่แจ้ง และขนาดของแบบจำลองล้วนส่งผลกระทบอย่างมากต่อคุณภาพ

การเรียนรู้การปรับแต่งพร้อมท์

การปรับแต่งพร้อมท์จะปรับโมเดลภาษาที่แช่แข็งโดยการเรียนรู้เวกเตอร์ 'soft prompt' จำนวนหนึ่งอย่างต่อเนื่องซึ่งเติมไว้ข้างหน้าอินพุต แทนที่จะเขียนคำด้วยมือ มันเป็นหนึ่งในวิธีที่น้อยที่สุดในการสร้างโมเดลขนาดยักษ์โดยเฉพาะ และจะดีขึ้นเมื่อโมเดลมีขนาดใหญ่ขึ้น Prompt Tuning เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Prompt Tuning เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งใช้พรอมต์การออกแบบ Prompt Tuning การดึงข้อมูล และลูปการตรวจสอบเป็นระบบการสื่อสารแบบรวมระบบเดียว โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในขณะเดียวกัน ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการปรับแต่งพร้อมท์

การปรับแต่งแบบทันทีทำให้แนวคิดนี้แพร่หลายมากขึ้นว่า คุณสามารถบังคับโมเดลฐานรากที่แข็งตัวด้วยสัญญาณการเรียนรู้เล็กๆ น้อยๆ และเป็นส่วนสนับสนุนชุดเครื่องมือ PEFT ในปัจจุบันส่วนใหญ่ ในขณะที่โมเดลขยายขนาดไปเรื่อยๆ เอฟเฟกต์การปิดช่องว่างทำให้ซอฟต์พรอมต์น่าสนใจสำหรับการปรับใช้หลายงานในราคาถูก การวิจัยกำลังขยายแนวคิดในการถ่ายโอนข้อความแจ้งที่เรียนรู้ได้ข้ามงานและแบบจำลอง ผสมผสานกับการดึงข้อมูล และใช้เพื่อสร้างรุ่นที่ควบคุมได้และปลอดภัยยิ่งขึ้น คาดว่า soft prompts จะยังคงเป็นตัวเลือกราคาประหยัดควบคู่ไปกับ LoRA และอะแดปเตอร์

การใช้งานจริงในโลกแห่งความเป็นจริง

เชี่ยวชาญโมเดล T5 แบบแช่แข็งหนึ่งรุ่นสำหรับงาน SuperGLUE จำนวนมาก โดยจัดเก็บ soft prompt แยกต่างหากสำหรับแต่ละงาน

ปรับใช้โมเดลขนาดใหญ่เพียงตัวเดียวกับลูกค้าจำนวนมากในราคาถูก โดยแต่ละโมเดลมีพร้อมท์การเรียนรู้ของตนเอง

การควบคุมความรู้สึกหรือพฤติกรรมการจำแนกประเภทโดยไม่ต้องใช้ถ้อยคำทางวิศวกรรมด้วยตนเอง

การถ่ายโอนพร้อมท์แบบนุ่มนวล: ฝึกอบรมพร้อมต์ล่วงหน้าในงานหนึ่งเพื่อเริ่มการเรียนรู้งานที่เกี่ยวข้องกัน

รูปแบบการดำเนินงาน

การปรับแต่งแบบทันทีในทางปฏิบัติ

เชี่ยวชาญโมเดล T5 แบบแช่แข็งหนึ่งรุ่นสำหรับงาน SuperGLUE จำนวนมาก โดยจัดเก็บ soft prompt แยกต่างหากสำหรับแต่ละงาน

มีความเชี่ยวชาญในโมเดล T5 แบบแช่แข็งหนึ่งโมเดลสำหรับงาน SuperGLUE หลายๆ งาน โดยจัดเก็บ soft prompt แยกต่างหากสำหรับแต่ละงาน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การปรับแต่งแบบทันทีในทางปฏิบัติ

ปรับใช้โมเดลขนาดใหญ่เพียงตัวเดียวกับลูกค้าจำนวนมากในราคาถูก โดยแต่ละโมเดลมีพร้อมท์การเรียนรู้ของตนเอง

การปรับใช้โมเดลขนาดใหญ่เพียงตัวเดียวกับลูกค้าหลายรายในราคาถูก โดยแต่ละโมเดลมีพร้อมท์การเรียนรู้ของตนเอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การปรับแต่งแบบทันทีในทางปฏิบัติ

การควบคุมความรู้สึกหรือพฤติกรรมการจำแนกประเภทโดยไม่ต้องใช้ถ้อยคำทางวิศวกรรมด้วยตนเอง

การควบคุมความรู้สึกหรือพฤติกรรมการจำแนกประเภทโดยไม่ต้องออกแบบถ้อยคำด้วยตนเอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การปรับแต่งแบบทันทีในทางปฏิบัติ

การถ่ายโอนพร้อมท์แบบนุ่มนวล: ฝึกอบรมพร้อมต์ล่วงหน้าในงานหนึ่งเพื่อเริ่มการเรียนรู้งานที่เกี่ยวข้องกัน

การถ่ายโอนพร้อมท์ทันที: ฝึกอบรมพร้อมต์ล่วงหน้าสำหรับงานหนึ่งเพื่อเริ่มการเรียนรู้งานที่เกี่ยวข้อง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ

!

ความละเอียดอ่อนของการแจ้งเตือนสามารถสร้างผลลัพธ์ที่ไม่สอดคล้องกันในคำขอที่คล้ายกัน

!

ข้อมูลข้อความที่ละเอียดอ่อนอาจถูกเปิดเผยหากการควบคุมการเข้าถึงอ่อนแอ

แผนงานการดำเนินงาน

1

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป