คู่มือ AI ภาษา

การสุ่มตัวอย่างนิวเคลียสและท็อปเค

การสุ่มตัวอย่างนิวเคลียส (top-p) และ top-k เป็นวิธีการถอดรหัสที่เพิ่มการสุ่มแบบควบคุมให้กับการสร้างข้อความโดยการจำกัดโทเค็นที่สามารถเลือกได้

ภาพรวม

การสุ่มตัวอย่างนิวเคลียส (top-p) และ top-k เป็นวิธีการถอดรหัสที่เพิ่มการสุ่มแบบควบคุมให้กับการสร้างข้อความโดยการจำกัดโทเค็นที่สามารถเลือกได้ สิ่งเหล่านี้มีความสำคัญเนื่องจากทำให้การเขียนด้วย AI รู้สึกเป็นธรรมชาติและหลากหลาย แทนที่จะเขียนซ้ำๆ หรือเป็นหุ่นยนต์

Nucleus และ Top-k Sampling เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด

เจาะลึก

โมเดลภาษาจะแสดงการแจกแจงความน่าจะเป็นของคำศัพท์ทั้งหมดในแต่ละขั้นตอน การสุ่มตัวอย่างโดยตรงจากมันสามารถเลือกโทเค็นที่แปลกประหลาดและน่าจะเป็นไปได้ต่ำ การใช้โทเค็นระดับบนสุด (โลภ) มักจะสร้างการวนซ้ำที่น่าเบื่อและซ้ำซาก การสุ่มตัวอย่าง Top-k แก้ไขปัญหานี้โดยเก็บเฉพาะโทเค็นความน่าจะเป็นสูงสุด k เท่านั้น (เช่น k=40) การปรับสภาพใหม่ และการสุ่มตัวอย่างในโทเค็นเหล่านั้น การสุ่มตัวอย่างนิวเคลียส นำโดย Holtzman และคณะ ในปี 2019 แทนที่จะเก็บชุดโทเค็นที่เล็กที่สุดซึ่งความน่าจะเป็นสะสมเกินเกณฑ์ p (เช่น 0.9) — 'นิวเคลียส' ข้อได้เปรียบที่สำคัญคือชุดนี้จะย่อลงเมื่อโมเดลมีความมั่นใจ และขยายออกเมื่อไม่แน่ใจ โดยมีการปรับเปลี่ยนแบบไดนามิก ทั้งสองอย่างมักถูกรวมเข้ากับพารามิเตอร์อุณหภูมิที่ทำให้การกระจายตัวมีความคมหรือราบเรียบก่อนที่จะสุ่มตัวอย่าง

ข้อมูลเชิงลึกทางเทคนิค

ความแตกต่างที่สำคัญได้รับการแก้ไขแล้วเมื่อเทียบกับจุดตัดแบบปรับตัว Top-k จะเก็บโทเค็น k ไว้เสมอ ซึ่งอาจมีจำนวนน้อยเกินไปหากมีหลายตัวเลือกที่สมเหตุสมผล หรือรวมขยะเมื่อมีเพียงไม่กี่รายการเท่านั้นที่สมเหตุสมผล Top-p เก็บตัวเลขตัวแปรไว้ — โทเค็นเพียงพอที่จะครอบคลุมมวลความน่าจะเป็น p — ดังนั้นจึงตัดส่วนหางยาวที่ไม่น่าเชื่อถือออก ในขณะเดียวกันก็คำนึงถึงการกระจายสูงสุดหรือแบนราบด้วย อุณหภูมิ (โดยทั่วไปคือ 0.7-1.0) จะปรับขนาดบันทึกใหม่ก่อนวิธีใดวิธีหนึ่ง: ค่าที่ต่ำกว่าจะเน้นไปที่ความน่าจะเป็น ค่าที่สูงกว่าจะกระจายออกไป

การเรียนรู้นิวเคลียสและการสุ่มตัวอย่าง Top-k

การสุ่มตัวอย่างนิวเคลียส (top-p) และ top-k เป็นวิธีการถอดรหัสที่เพิ่มการสุ่มแบบควบคุมให้กับการสร้างข้อความโดยการจำกัดโทเค็นที่สามารถเลือกได้ สิ่งเหล่านี้มีความสำคัญเนื่องจากทำให้การเขียนด้วย AI รู้สึกเป็นธรรมชาติและหลากหลาย แทนที่จะเขียนซ้ำๆ หรือเป็นหุ่นยนต์ Nucleus และ Top-k Sampling เป็นส่วนหนึ่งของสแต็กภาษา-AI ที่ใช้ในการอ่าน สร้าง จำแนก และแปลงข้อความและคำพูดตามขนาด เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Nucleus และ Top-k Sampling เป็นแบบจำลองการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งโดยใช้การออกแบบการแจ้งเตือน การดึงข้อมูล และการตรวจสอบลูป Nucleus และ Top-k Sampling เป็นระบบการสื่อสารแบบรวมระบบเดียว โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในขณะเดียวกัน ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ

ขั้นตอนการทำงานของภาษาสามารถดำเนินไปได้เร็วขึ้นโดยไม่กระทบต่อความสม่ำเสมอ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร

ขยายการเข้าถึงภาษาและรูปแบบการสื่อสาร ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ

ทีมสามารถใช้เวลามากขึ้นในการตัดสิน ในขณะที่ระบบอัตโนมัติจัดการกับการทำซ้ำ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของนิวเคลียสและการสุ่มตัวอย่าง Top-k

ขณะนี้การถอดรหัสตามการสุ่มตัวอย่างเป็นค่าเริ่มต้นสำหรับแชทบอทและเครื่องมือสร้างสรรค์ และการวิจัยยังคงปรับปรุงให้ดีขึ้น: วิธีการต่างๆ เช่น การสุ่มตัวอย่างทั่วไป min-p และการสุ่มตัวอย่าง eta/epsilon มีจุดมุ่งหมายเพื่อตัดส่วนหางอย่างชาญฉลาดมากกว่า p หรือ k คงที่ คาดหวังว่าพารามิเตอร์การถอดรหัสจะรับรู้บริบทและเรียนรู้มากขึ้น โดยจะกระชับคำตอบที่เป็นข้อเท็จจริงโดยอัตโนมัติและคลายการระดมความคิด เมื่อแบบจำลองได้รับการปรับปรุง การควบคุมการสุ่มตัวอย่างอย่างระมัดระวังยังคงเป็นสิ่งจำเป็นสำหรับการรักษาสมดุลความน่าเชื่อถือ ความหลากหลาย และการลดอาการประสาทหลอน

การใช้งานจริงในโลกแห่งความเป็นจริง

Chatbots ใช้ top-p ประมาณ 0.9 เพื่อให้การตอบกลับมีความหลากหลายแต่สอดคล้องกันในการสนทนา

ผู้ช่วยด้านการเขียนเชิงสร้างสรรค์ที่เพิ่มอุณหภูมิและความคิดเพื่อระดมความคิดเกี่ยวกับเรื่องราวที่หลากหลาย

เครื่องมือสร้างโค้ดที่ลดอุณหภูมิและ k เพื่อให้ได้ตัวอย่างข้อมูลที่ถูกต้องและกำหนดได้มากขึ้น

ผู้ใช้ API ปรับพารามิเตอร์ top_p และ top_k เพื่อควบคุมว่าเอาต์พุตของโมเดลจะน่าตื่นเต้นเพียงใด

รูปแบบการดำเนินงาน

การสุ่มตัวอย่างนิวเคลียสและ Top-k ในทางปฏิบัติ

Chatbots ใช้ top-p ประมาณ 0.9 เพื่อให้การตอบกลับมีความหลากหลายแต่สอดคล้องกันในการสนทนา

แชทบอทที่ใช้ top-p ประมาณ 0.9 เพื่อให้การตอบกลับมีความหลากหลายแต่สอดคล้องกันในการสนทนา ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสุ่มตัวอย่างนิวเคลียสและ Top-k ในทางปฏิบัติ

ผู้ช่วยด้านการเขียนเชิงสร้างสรรค์ที่เพิ่มอุณหภูมิและความคิดเพื่อระดมความคิดเกี่ยวกับเรื่องราวที่หลากหลาย

ผู้ช่วยด้านการเขียนเชิงสร้างสรรค์ยกระดับอุณหภูมิและความคิดเพื่อระดมความคิดเกี่ยวกับเรื่องราวที่หลากหลาย ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสุ่มตัวอย่างนิวเคลียสและ Top-k ในทางปฏิบัติ

เครื่องมือสร้างโค้ดที่ลดอุณหภูมิและ k เพื่อให้ได้ตัวอย่างข้อมูลที่ถูกต้องและกำหนดได้มากขึ้น

เครื่องมือสร้างโค้ดที่ลดอุณหภูมิและ k สำหรับตัวอย่างข้อมูลที่ถูกต้องและกำหนดได้มากขึ้น ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การสุ่มตัวอย่างนิวเคลียสและ Top-k ในทางปฏิบัติ

ผู้ใช้ API ปรับพารามิเตอร์ top_p และ top_k เพื่อควบคุมว่าเอาต์พุตของโมเดลจะน่าตื่นเต้นเพียงใด

ผู้ใช้ API ปรับแต่งพารามิเตอร์ top_p และ top_k เพื่อควบคุมว่าเอาต์พุตของโมเดลนั้นน่าตื่นเต้นแค่ไหน โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีขึ้น เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

ข้อเท็จจริงที่หลอนประสาทสามารถเข้าสู่รายงาน กระแสสนับสนุน หรือผลการวิจัยได้อย่างเงียบๆ

!

ความละเอียดอ่อนของการแจ้งเตือนสามารถสร้างผลลัพธ์ที่ไม่สอดคล้องกันในคำขอที่คล้ายกัน

!

ข้อมูลข้อความที่ละเอียดอ่อนอาจถูกเปิดเผยหากการควบคุมการเข้าถึงอ่อนแอ

แผนงานการดำเนินงาน

1

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว

กำหนดรูปแบบเอาต์พุต โทนเสียง และมาตรฐานคุณภาพก่อนเปิดตัว ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ

การตอบสนองภาคพื้นดินกับแหล่งข้อมูลที่เชื่อถือได้เมื่อใดก็ตามที่ความแม่นยำมีความสำคัญ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง

รักษาจุดตรวจสอบการตรวจสอบโดยมนุษย์สำหรับผลลัพธ์ที่มีเดิมพันสูง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ

ติดตามรูปแบบความล้มเหลวและฝึกอบรมพร้อมท์หรือเวิร์กโฟลว์เป็นประจำ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป