คู่มือพื้นฐาน

ปรากฏการณ์ดับเบิ้ลเดสท์

การสืบเชื้อสายสองครั้งเป็นการสังเกตที่น่าประหลาดใจว่าเมื่อแบบจำลองมีขนาดใหญ่ขึ้น ข้อผิดพลาดในการทดสอบก่อนจะแย่ลงเมื่อใกล้ถึง 'เกณฑ์การแก้ไข' แต่จากนั้นก็ดีขึ้นอีกครั้ง ซึ่งเป็นการท้าทายข้อดีข้อเสียของตำราเรียนแบบคลาสสิก

ภาพรวม

การสืบเชื้อสายสองครั้งเป็นการสังเกตที่น่าประหลาดใจว่าเมื่อแบบจำลองมีขนาดใหญ่ขึ้น ข้อผิดพลาดในการทดสอบก่อนจะแย่ลงเมื่อใกล้ถึง 'เกณฑ์การแก้ไข' แต่จากนั้นก็ดีขึ้นอีกครั้ง ซึ่งเป็นการท้าทายข้อดีข้อเสียของตำราเรียนแบบคลาสสิก เป็นเรื่องสำคัญเพราะมันช่วยอธิบายว่าทำไมโครงข่ายประสาทเทียมขนาดใหญ่ที่มีพารามิเตอร์มากเกินไปจึงพูดคุยกันได้ดีแทนที่จะติดตั้งมากเกินไป

Double Descent Phenomenon อยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น

เจาะลึก

สถิติคลาสสิกสอนเส้นโค้งรูปตัวยู: เมื่อความซับซ้อนของแบบจำลองเพิ่มขึ้น ข้อผิดพลาดในการทดสอบลดลง ต่ำสุด แล้วเพิ่มขึ้นเมื่อแบบจำลองเกินพอดี การสืบเชื้อสายสองครั้ง ซึ่งเป็นที่นิยมโดย Belkin, Hsu, Ma และ Mandal ในปี 2019 และศึกษาในระดับโดย OpenAI แสดงให้เห็นว่าเส้นโค้งมีการสืบเชื้อสายครั้งที่สอง ข้อผิดพลาดในการทดสอบจะถึงจุดสูงสุดที่เกณฑ์การแก้ไข ซึ่งเป็นจุดที่แบบจำลองมีพารามิเตอร์เพียงพอที่จะพอดีกับทุกจุดการฝึก (ข้อผิดพลาดในการฝึกเป็นศูนย์) ผลักดันสิ่งนั้นให้เข้าสู่ระบบการปกครองที่มีพารามิเตอร์มากเกินไป และข้อผิดพลาดในการทดสอบจะลดลงอีกครั้ง ซึ่งมักจะต่ำกว่าจุดหวานแบบคลาสสิก เอฟเฟกต์เดียวกันนี้จะปรากฏบนขนาดโมเดล เวลาการฝึก (การลงสองครั้งแบบ 'ยุคสมัย') และขนาดชุดข้อมูล มันตอกย้ำความกลัวเก่าๆ ที่ว่า 'พารามิเตอร์ที่มากขึ้นมักจะหมายถึงการมีอุปกรณ์มากเกินไป'

ข้อมูลเชิงลึกทางเทคนิค

ที่เกณฑ์การแก้ไขจะมีวิธีแก้ปัญหาหนึ่งที่เหมาะกับข้อมูลทุกประการ และถูกบังคับให้มีรอยหยักและเป็นบรรทัดฐานสูง ดังนั้นจึงสรุปได้ไม่ดี ในระบบการปกครองที่มีพารามิเตอร์มากเกินไป มีวิธีแก้ไขข้อผิดพลาดเป็นศูนย์มากมายนับไม่ถ้วน และอคติโดยนัยของการไล่ระดับลงจะมุ่งไปสู่วิธีที่ราบรื่นที่สุดและเป็นบรรทัดฐานต่ำสุด การตั้งค่าอินเทอร์โพเลเตอร์ที่มีความซับซ้อนต่ำนั้น ไม่ใช่การนับพารามิเตอร์ เป็นสิ่งที่ผลักดันให้ข้อผิดพลาดในการทดสอบลดลงครั้งที่สอง

การเรียนรู้ปรากฏการณ์ Double Descent

การสืบเชื้อสายสองครั้งเป็นการสังเกตที่น่าประหลาดใจว่าเมื่อแบบจำลองมีขนาดใหญ่ขึ้น ข้อผิดพลาดในการทดสอบก่อนจะแย่ลงเมื่อใกล้ถึง 'เกณฑ์การแก้ไข' แต่จากนั้นก็ดีขึ้นอีกครั้ง ซึ่งเป็นการท้าทายข้อดีข้อเสียของตำราเรียนแบบคลาสสิก เป็นเรื่องสำคัญเพราะมันช่วยอธิบายว่าทำไมโครงข่ายประสาทเทียมขนาดใหญ่ที่มีพารามิเตอร์มากเกินไปจึงพูดคุยกันได้ดีแทนที่จะติดตั้งมากเกินไป Double Descent Phenomenon อยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Double Descent Phenomenon เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังคงต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Double Descent Phenomenon จะสร้างโมเดลเชิงแนวคิดที่แข็งแกร่งก่อน จากนั้นจึงจับคู่โมเดลเหล่านั้นกับข้อจำกัดในการผลิตจริง โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในเวลาเดียวกัน ทีมต่างๆ อาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของปรากฏการณ์ Double Descent

นักวิจัยใช้ double descent เพื่อปรับแต่งกฎมาตราส่วนและเลือกเวลาที่จะหยุดการฝึกอบรม เนื่องจาก 'ฝึกให้นานขึ้น แย่ลง แล้วดีขึ้น' มีผลกระทบต่อต้นทุนอย่างแท้จริง คาดว่าทฤษฎีที่เข้มงวดกว่านี้จะเชื่อมโยงกับการทำให้เป็นมาตรฐานโดยนัย เคอร์เนลแทนเจนต์ของระบบประสาท และ grokking ในทางปฏิบัติแล้ว บทเรียนที่ใหญ่ขึ้นและยาวขึ้นสามารถช่วยผ่านเขตอันตรายได้ ถือเป็นรากฐานของการตัดสินใจในการฝึกแบบจำลองฐานรากที่มีขนาดใหญ่กว่าเดิม แทนที่จะกำหนดขนาดอย่างระมัดระวัง

การใช้งานจริงในโลกแห่งความเป็นจริง

อธิบายว่าเหตุใดโมเดลภาษาที่มีพารามิเตอร์ 175 พันล้านพารามิเตอร์จึงสรุปได้ดีกว่าโมเดลขนาดกลางที่ได้รับการปรับแต่งอย่างระมัดระวัง แม้ว่าจะมีความจุมากกว่าอย่างมากมายก็ตาม

เลือกที่จะฝึกฝนผ่านจุดที่การสูญเสียการตรวจสอบความถูกต้องแย่ลงชั่วคราว เนื่องจากการสืบเชื้อสายแบบสองครั้งที่ชาญฉลาดในยุคทำนายการฟื้นตัวในภายหลัง

การวินิจฉัยโมเดลการมองเห็นซึ่งมีความแม่นยำลดลงอย่างแน่นอนเมื่อจำนวนพารามิเตอร์ตรงกับขนาดชุดการฝึก จากนั้นให้ข้อมูลเชิงลึกเกี่ยวกับการกำหนดพารามิเตอร์เกิน

แจ้งการตัดสินใจเกี่ยวกับขนาดโมเดลใน AutoML เพื่อให้ผู้ปฏิบัติงานหลีกเลี่ยงเขตเกณฑ์การแก้ไขที่เปราะบาง

รูปแบบการดำเนินงาน

ปรากฏการณ์ Double Descent ในทางปฏิบัติ

อธิบายว่าเหตุใดโมเดลภาษาที่มีพารามิเตอร์ 175 พันล้านพารามิเตอร์จึงสรุปได้ดีกว่าโมเดลขนาดกลางที่ได้รับการปรับแต่งอย่างระมัดระวัง แม้ว่าจะมีความจุมากกว่าก็ตาม

อธิบายว่าเหตุใดโมเดลภาษาที่มีพารามิเตอร์ 1.75 แสนล้านพารามิเตอร์จึงสรุปได้ดีกว่าโมเดลขนาดกลางที่ได้รับการปรับแต่งอย่างระมัดระวัง แม้ว่าจะมีความจุมากกว่าปกติ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพไว้ล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ปรากฏการณ์ Double Descent ในทางปฏิบัติ

การเลือกฝึกฝนผ่านจุดที่การสูญเสียการตรวจสอบความถูกต้องแย่ลงชั่วคราว เนื่องจากการสืบเชื้อสายแบบคู่ในยุคสมัยคาดการณ์ว่าจะมีการฟื้นตัวในภายหลัง

การเลือกฝึกฝนผ่านจุดที่การสูญเสียการตรวจสอบความถูกต้องแย่ลงชั่วคราว เนื่องจากยุคสมัยแบบ double descent คาดการณ์ว่าทีมกู้คืนในภายหลังมักจะได้รับผลลัพธ์ที่ดีกว่า เมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ปรากฏการณ์ Double Descent ในทางปฏิบัติ

การวินิจฉัยโมเดลการมองเห็นซึ่งมีความแม่นยำลดลงอย่างแน่นอนเมื่อจำนวนพารามิเตอร์ตรงกับขนาดชุดการฝึก จากนั้นจึงชี้แนะให้ลึกยิ่งขึ้นในการกำหนดพารามิเตอร์เกิน

การวินิจฉัยโมเดลการมองเห็นซึ่งมีความแม่นยำลดลงอย่างแน่นอนเมื่อจำนวนพารามิเตอร์ตรงกับขนาดชุดการฝึก จากนั้นให้เจาะลึกเข้าไปในการกำหนดพารามิเตอร์เกิน โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ปรากฏการณ์ Double Descent ในทางปฏิบัติ

แจ้งการตัดสินใจเกี่ยวกับขนาดโมเดลใน AutoML เพื่อให้ผู้ปฏิบัติงานหลีกเลี่ยงโซนเกณฑ์การแก้ไขที่เปราะบาง

แจ้งการตัดสินใจกำหนดขนาดโมเดลใน AutoML เพื่อให้ผู้ปฏิบัติงานหลีกเลี่ยงโซนเกณฑ์การแก้ไขที่เปราะบาง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

แต่ละทีมอาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ

!

เกณฑ์มาตรฐานอาจดูแข็งแกร่งในขณะที่ประสิทธิภาพในโลกแห่งความเป็นจริงไม่เท่ากัน

!

การเพิกเฉยต่อคุณภาพข้อมูลและแผนการประเมินมักสร้างผลลัพธ์ที่เปราะบาง

แผนงานการดำเนินงาน

1

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เอกสารที่ปรากฏการณ์ Double Descent ช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า

เอกสารที่ปรากฏการณ์ Double Descent ช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป