คู่มือพื้นฐาน

ค้นหาสถาปัตยกรรมประสาท

การค้นหาสถาปัตยกรรมประสาท (NAS) ทำให้การออกแบบโครงสร้างโครงข่ายประสาทเทียมเป็นไปโดยอัตโนมัติ โดยให้อัลกอริธึม (ไม่ใช่มนุษย์) ตัดสินใจว่าจะมีเลเยอร์กี่ชั้น ปฏิบัติการใด และเชื่อมต่อกันอย่างไร

ภาพรวม

การค้นหาสถาปัตยกรรมประสาท (NAS) ทำให้การออกแบบโครงสร้างโครงข่ายประสาทเทียมเป็นไปโดยอัตโนมัติ โดยให้อัลกอริธึม (ไม่ใช่มนุษย์) ตัดสินใจว่าจะมีเลเยอร์กี่ชั้น ปฏิบัติการใด และเชื่อมต่อกันอย่างไร เปลี่ยนการออกแบบแบบจำลองให้กลายเป็นปัญหาในการค้นหา โดยค้นพบสถาปัตยกรรมที่สามารถแข่งขันหรือเอาชนะงานที่ทำด้วยมือได้

การค้นหาสถาปัตยกรรมประสาทอยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น

เจาะลึก

การออกแบบโครงข่ายประสาทเทียมด้วยมือนั้นช้าและอาศัยสัญชาตญาณของผู้เชี่ยวชาญ NAS แทนที่สิ่งนั้นด้วยการค้นหาพื้นที่ที่กำหนดไว้ของสถาปัตยกรรมที่เป็นไปได้ ซึ่งได้รับคำแนะนำจากกลยุทธ์ที่เสนอผู้สมัคร และวิธีการประเมินว่าแต่ละสถาปัตยกรรมนั้นดีเพียงใด NAS ในยุคแรกๆ ใช้การเรียนรู้แบบเสริมกำลังหรืออัลกอริธึมเชิงวิวัฒนาการ ฝึกอบรมเครือข่ายผู้สมัครหลายพันเครือข่าย ซึ่งมีชื่อเสียงว่าต้องใช้ GPU หลายพันวัน ความก้าวหน้าครั้งนี้ทำให้การค้นหาถูกลง: การแบ่งปันน้ำหนัก ("ซูเปอร์เน็ต" ที่มีผู้สมัครทั้งหมด) และวิธีการที่แตกต่าง เช่น DARTS ซึ่งจะทำให้ตัวเลือกที่แยกจากกันกลายเป็นตัวเลือกที่ต่อเนื่องกัน เพื่อให้การไล่ระดับสีสามารถปรับสถาปัตยกรรมและน้ำหนักให้เหมาะสมร่วมกัน NAS ผลิตโมเดลที่มีประสิทธิภาพ เช่น EfficientNet และเครือข่ายที่ปรับให้เหมาะกับมือถือหลายเครือข่ายที่ใช้ในการผลิตในปัจจุบัน

ข้อมูลเชิงลึกทางเทคนิค

NAS มีองค์ประกอบสามประการ: พื้นที่การค้นหา (ส่วนประกอบและวิธีเชื่อมต่อ) กลยุทธ์การค้นหา (การเรียนรู้แบบเสริมกำลัง วิวัฒนาการ การค้นหาแบบสุ่ม หรือการไล่ระดับสี) และวิธีการประมาณค่าประสิทธิภาพ การฝึกอบรมผู้สมัครแต่ละคนให้มาบรรจบกันอย่างไร้เดียงสามีค่าใช้จ่ายสูง ดังนั้น NAS จึงใช้ทางลัด: การแบ่งปันน้ำหนักผ่านซูเปอร์เน็ต พร็อกซีที่มีความเที่ยงตรงต่ำ (ยุคน้อยลง ข้อมูลน้อยลง) และเรียนรู้ตัวทำนาย DARTS ทำให้ตัวเลือกที่ไม่ต่อเนื่องของ 'การดำเนินการใดที่อยู่ที่นี่' ต่อเนื่องผ่านส่วนผสมที่มีน้ำหนักสูงสุด ปรับให้เหมาะสมด้วยการไล่ระดับสี จากนั้นแยกผลลัพธ์ออกเป็นสถาปัตยกรรมขั้นสุดท้าย

เชี่ยวชาญการค้นหาสถาปัตยกรรมประสาท

การค้นหาสถาปัตยกรรมประสาท (NAS) ทำให้การออกแบบโครงสร้างโครงข่ายประสาทเทียมเป็นไปโดยอัตโนมัติ โดยให้อัลกอริธึม (ไม่ใช่มนุษย์) ตัดสินใจว่าจะมีเลเยอร์กี่ชั้น ปฏิบัติการใด และเชื่อมต่อกันอย่างไร เปลี่ยนการออกแบบแบบจำลองให้กลายเป็นปัญหาในการค้นหา โดยค้นพบสถาปัตยกรรมที่สามารถแข่งขันหรือเอาชนะงานที่ทำด้วยมือได้ การค้นหาสถาปัตยกรรมประสาทอยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Neural Architecture Search เป็นโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Neural Architecture Search จะสร้างโมเดลเชิงแนวคิดที่แข็งแกร่งก่อน จากนั้นจึงจับคู่โมเดลเหล่านั้นกับข้อจำกัดในการผลิตจริง โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในเวลาเดียวกัน ทีมต่างๆ อาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการค้นหาสถาปัตยกรรมประสาท

NAS กำลังขยายจากเป้าหมายที่แม่นยำเท่านั้นไปจนถึงการค้นหาแบบหลายวัตถุประสงค์ที่คำนึงถึงฮาร์ดแวร์ ซึ่งร่วมกันปรับเวลาแฝง พลังงาน และหน่วยความจำสำหรับชิปเฉพาะ ซึ่งมีความสำคัญสำหรับ Edge และ AI บนมือถือ พร็อกซีที่ไม่มีค่าใช้จ่ายซึ่งจัดอันดับสถาปัตยกรรมโดยไม่ได้รับการฝึกอบรมกำลังเร่งการค้นหาอย่างรวดเร็ว ในขณะที่หม้อแปลงมีอิทธิพลเหนือ NAS จะถูกนำไปใช้กับรูปแบบความสนใจ ความกว้างของเลเยอร์ และการกำหนดค่า LLM ทั้งหมด และกำลังผสานเข้ากับไปป์ไลน์การเรียนรู้ของเครื่องอัตโนมัติ ขอบเขตคือการออกแบบโมเดลและฮาร์ดแวร์ร่วมกัน โดยมีลูปการค้นหาที่ปรับให้เข้ากับข้อจำกัดในการปรับใช้โดยอัตโนมัติ

การใช้งานจริงในโลกแห่งความเป็นจริง

กลุ่มผลิตภัณฑ์ EfficientNet ของ Google ซึ่งมีสถาปัตยกรรมแบบปรับขนาดผสมได้รับคำแนะนำจากการค้นหาอัตโนมัติเพื่อความแม่นยำที่แข็งแกร่งต่อ FLOP

โมเดลการมองเห็นบนมือถือ (เช่น MnasNet) ค้นหาด้วยเวลาแฝงบนโทรศัพท์จริงในวงเพื่อความเร็วบนอุปกรณ์

NAS ที่รับรู้ฮาร์ดแวร์ซึ่งปรับแต่งเครือข่ายให้เหมาะกับหน่วยความจำของตัวเร่งความเร็วเฉพาะและขีดจำกัดการประมวลผล

แพลตฟอร์ม AutoML ที่ให้ผู้ที่ไม่ใช่ผู้เชี่ยวชาญได้รับโมเดลที่กำหนดเองเพื่อการแข่งขันโดยการค้นหาสถาปัตยกรรมโดยอัตโนมัติ

รูปแบบการดำเนินงาน

การค้นหาสถาปัตยกรรมประสาทในทางปฏิบัติ

กลุ่มผลิตภัณฑ์ EfficientNet ของ Google ซึ่งมีสถาปัตยกรรมแบบปรับขนาดผสมได้รับคำแนะนำจากการค้นหาอัตโนมัติเพื่อความแม่นยำที่แข็งแกร่งต่อ FLOP

กลุ่มผลิตภัณฑ์ EfficientNet ของ Google ซึ่งมีสถาปัตยกรรมแบบปรับขนาดแบบผสมซึ่งได้รับคำแนะนำจากการค้นหาอัตโนมัติสำหรับทีมที่มีความแม่นยำต่อ FLOP ที่แข็งแกร่ง มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การค้นหาสถาปัตยกรรมประสาทในทางปฏิบัติ

โมเดลการมองเห็นบนมือถือ (เช่น MnasNet) ค้นหาด้วยเวลาแฝงบนโทรศัพท์จริงในวงเพื่อความเร็วบนอุปกรณ์

โมเดลการมองเห็นบนมือถือ (เช่น MnasNet) ค้นหาด้วยเวลาแฝงบนโทรศัพท์จริงในลูปสำหรับความเร็วบนอุปกรณ์ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การค้นหาสถาปัตยกรรมประสาทในทางปฏิบัติ

NAS ที่รับรู้ฮาร์ดแวร์ซึ่งปรับแต่งเครือข่ายให้เหมาะกับหน่วยความจำของตัวเร่งความเร็วเฉพาะและขีดจำกัดการประมวลผล

NAS ที่รับรู้ฮาร์ดแวร์ซึ่งปรับแต่งเครือข่ายให้เหมาะกับหน่วยความจำของเครื่องเร่งความเร็วเฉพาะและขีดจำกัดในการประมวลผล ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การค้นหาสถาปัตยกรรมประสาทในทางปฏิบัติ

แพลตฟอร์ม AutoML ที่ให้ผู้ที่ไม่ใช่ผู้เชี่ยวชาญได้รับโมเดลที่กำหนดเองเพื่อการแข่งขันโดยการค้นหาสถาปัตยกรรมโดยอัตโนมัติ

แพลตฟอร์ม AutoML ที่ให้ผู้ที่ไม่ใช่ผู้เชี่ยวชาญได้รับโมเดลแบบกำหนดเองเพื่อการแข่งขันโดยการค้นหาสถาปัตยกรรมโดยอัตโนมัติ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

แต่ละทีมอาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ

!

เกณฑ์มาตรฐานอาจดูแข็งแกร่งในขณะที่ประสิทธิภาพในโลกแห่งความเป็นจริงไม่เท่ากัน

!

การเพิกเฉยต่อคุณภาพข้อมูลและแผนการประเมินมักสร้างผลลัพธ์ที่เปราะบาง

แผนงานการดำเนินงาน

1

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เอกสารที่การค้นหาสถาปัตยกรรมประสาทช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า

เอกสารที่การค้นหาสถาปัตยกรรมประสาทช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป