คู่มือแอปพลิเคชัน

AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่น

AI ใช้การเรียนรู้การเสริมกำลังเพื่อควบคุมพลาสมาความร้อนยวดยิ่งภายในเครื่องปฏิกรณ์ฟิวชันแบบเรียลไทม์ โดยคงความเสถียรไว้นานพอที่จะปล่อยพลังงาน

ภาพรวม

AI ใช้การเรียนรู้การเสริมกำลังเพื่อควบคุมพลาสมาความร้อนยวดยิ่งภายในเครื่องปฏิกรณ์ฟิวชันแบบเรียลไทม์ โดยคงความเสถียรไว้นานพอที่จะปล่อยพลังงาน เป็นเรื่องสำคัญเนื่องจากความไม่เสถียรของพลาสมาเป็นหนึ่งในอุปสรรคที่ใหญ่ที่สุดที่ขวางกั้นระหว่างเรากับพลังฟิวชั่นที่สะอาดและแทบจะไร้ขีดจำกัด

AI ในการควบคุมพลาสมาฟิวชั่นนิวเคลียร์มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นขั้นตอนการทำงานรายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้

เจาะลึก

ภายในโทคามัก พลาสมาของไฮโดรเจนมีอุณหภูมิสูงกว่า 100 ล้านองศาเซลเซียส และจะต้องอยู่ห่างจากผนังด้วยสนามแม่เหล็กอันทรงพลัง พลาสมามีความปั่นป่วนและไม่เสถียร และการควบคุมรูปร่างจำเป็นต้องปรับขดลวดแม่เหล็กหลายสิบเส้นหลายพันครั้งต่อวินาที ซึ่งเร็วกว่ามนุษย์ และยากสำหรับตัวควบคุมที่ปรับด้วยมือ ในปี 2022 Google DeepMind และ Swiss Plasma Center ได้ฝึกอบรมตัวแทนการเรียนรู้การเสริมแรงเพื่อควบคุมขดลวดแม่เหล็กของ TCV tokamak ซึ่งประสบความสำเร็จในการปรับรูปร่างพลาสมาให้เป็นโครงแบบต่างๆ เช่น รูปร่างที่ยาวและ 'หยด' นอกจากนี้ AI ยังคาดการณ์การหยุดชะงัก การพังทลายอย่างกะทันหันที่สามารถสร้างความเสียหายให้กับเครื่องปฏิกรณ์ได้ ทำให้ผู้ปฏิบัติงานมีเวลาอันมีค่าในการตอบสนองเป็นมิลลิวินาที นักวิจัยของ Princeton ได้สาธิตแบบจำลองที่ทำนายและช่วยหลีกเลี่ยงความไม่เสถียรของโหมดการฉีกขาดก่อนที่จะเกิดขึ้น

ข้อมูลเชิงลึกทางเทคนิค

แนวทางของ DeepMind ได้ฝึกฝนตัวควบคุมการเรียนรู้การเสริมกำลังเชิงลึกภายในเครื่องจำลองพลาสมาที่แม่นยำ ปล่อยให้ทำการทดลองได้อย่างปลอดภัยนับล้านครั้งก่อนที่จะสัมผัสฮาร์ดแวร์จริง โครงข่ายประสาทเทียมแมปการอ่านเซ็นเซอร์แบบเรียลไทม์ เช่น การวัดแม่เหล็ก โดยตรงกับคำสั่งแรงดันไฟฟ้าสำหรับคอยล์ โดยแทนที่ชุดควบคุมที่ออกแบบแยกกันด้วยนโยบายการเรียนรู้เดียว สิ่งสำคัญที่สุดคือมันทำงานเร็วพอที่จะออกคำสั่งในระดับมิลลิวินาทีตามความต้องการพลาสมา

การเรียนรู้ AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่น

AI ใช้การเรียนรู้การเสริมกำลังเพื่อควบคุมพลาสมาความร้อนยวดยิ่งภายในเครื่องปฏิกรณ์ฟิวชันแบบเรียลไทม์ โดยคงความเสถียรไว้นานพอที่จะปล่อยพลังงาน เป็นเรื่องสำคัญเนื่องจากความไม่เสถียรของพลาสมาเป็นหนึ่งในอุปสรรคที่ใหญ่ที่สุดที่ขวางกั้นระหว่างเรากับพลังฟิวชั่นที่สะอาดและแทบจะไร้ขีดจำกัด AI ในการควบคุมพลาสมาฟิวชั่นนิวเคลียร์มุ่งเน้นไปที่การใช้งานจริง: เปลี่ยนความสามารถของโมเดลให้เป็นขั้นตอนการทำงานรายวันที่เชื่อถือได้ซึ่งส่งมอบมูลค่าที่วัดได้ เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ปฏิบัติต่อ AI ในการควบคุมพลาสมาฟิวชั่นนิวเคลียร์เป็นแบบจำลองการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังคงต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ AI ในการควบคุมพลาสมาฟิวชั่นนิวเคลียร์มุ่งเน้นไปที่ผลลัพธ์ของเวิร์กโฟลว์ ไม่ใช่จำลองการสาธิต และกำหนดจุดตรวจสอบของมนุษย์ตั้งแต่เนิ่นๆ โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในขณะเดียวกัน การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่

การออกแบบระดับแอปพลิเคชันจะกำหนดว่า AI จะปรับปรุงผลลัพธ์ที่แท้จริงหรือไม่ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้

การบูรณาการขั้นตอนการทำงานที่ดีจะช่วยเพิ่มผลผลิตที่ผู้ใช้ไว้วางใจได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ

กรณีการใช้งานที่มีขอบเขตดีจะช่วยลดความเหนื่อยล้าของการเปลี่ยนแปลงและความเสี่ยงในการดำเนินการ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชัน

เนื่องจากเครื่องปฏิกรณ์อย่าง ITER และกิจการเอกชนเข้าใกล้สภาวะการเผาไหม้ของพลาสมา ตัวควบคุม AI จึงมีความสำคัญเนื่องจากความไม่เสถียรจะยากขึ้นในการจัดการด้วยพลังงานที่สูงขึ้น คาดหวังแบบจำลองที่คาดการณ์การหยุดชะงักล่วงหน้าไม่กี่วินาทีและปรับโดยอัตโนมัติเพื่อป้องกันสิ่งเหล่านั้น รวมถึง AI ที่ใช้ในการเพิ่มประสิทธิภาพการออกแบบเครื่องปฏิกรณ์และกลยุทธ์การฉีดเชื้อเพลิง แบบจำลองตัวแทนที่ประมาณการจำลองทางฟิสิกส์ราคาแพงจะช่วยให้วิศวกรสำรวจการออกแบบจำนวนมากได้อย่างรวดเร็ว ซึ่งอาจช่วยลดเส้นทางไปสู่พลังงานฟิวชันเชิงพาณิชย์ได้

การใช้งานจริงในโลกแห่งความเป็นจริง

Google DeepMind และ Swiss Plasma Center ใช้การเรียนรู้แบบเสริมกำลังเพื่อควบคุมขดลวดแม่เหล็กของ TCV tokamak และปั้นพลาสมาให้เป็นรูปร่างเป้าหมาย

นักวิจัยในห้องปฏิบัติการฟิสิกส์พลาสมาพรินซ์ตันสร้างแบบจำลอง AI ที่คาดการณ์และช่วยหลีกเลี่ยงความไม่เสถียรของโหมดการฉีกขาดที่โรงงาน DIII-D

Commonwealth Fusion Systems และบริษัทเอกชนอื่นๆ ใช้ ML เพื่อเพิ่มประสิทธิภาพการออกแบบแม่เหล็กและเครื่องปฏิกรณ์

แบบจำลองตัวแทน AI เข้ามาแทนที่การจำลองทางฟิสิกส์ที่ช้า เพื่อสำรวจสถานการณ์พลาสมาอย่างรวดเร็วในระหว่างการวางแผนการทดลอง

รูปแบบการดำเนินงาน

AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่นในทางปฏิบัติ

Google DeepMind และ Swiss Plasma Center ใช้การเรียนรู้แบบเสริมกำลังเพื่อควบคุมขดลวดแม่เหล็กของ TCV tokamak และปั้นพลาสมาให้เป็นรูปร่างเป้าหมาย

Google DeepMind และ Swiss Plasma Center ใช้การเรียนรู้แบบเสริมกำลังเพื่อควบคุมขดลวดแม่เหล็กของ TCV tokamak และปั้นพลาสมาให้เป็นรูปร่างเป้าหมาย โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับ Edge Case และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่นในทางปฏิบัติ

นักวิจัยในห้องปฏิบัติการฟิสิกส์พลาสมาพรินซ์ตันสร้างแบบจำลอง AI ที่คาดการณ์และช่วยหลีกเลี่ยงความไม่เสถียรของโหมดการฉีกขาดที่โรงงาน DIII-D

นักวิจัยในห้องปฏิบัติการฟิสิกส์พรินซ์ตันพลาสมาสร้างแบบจำลอง AI ที่คาดการณ์และช่วยหลีกเลี่ยงความไม่เสถียรของโหมดการฉีกขาดที่โรงงาน DIII-D มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่นในทางปฏิบัติ

Commonwealth Fusion Systems และบริษัทเอกชนอื่นๆ ใช้ ML เพื่อเพิ่มประสิทธิภาพการออกแบบแม่เหล็กและเครื่องปฏิกรณ์

Commonwealth Fusion Systems และบริษัทเอกชนอื่นๆ ใช้ ML เพื่อเพิ่มประสิทธิภาพการออกแบบแม่เหล็กและเครื่องปฏิกรณ์ โดยปกติแล้วทีมจะได้รับผลลัพธ์ที่ดีกว่าเมื่อกำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับ Edge Case และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI ในการควบคุมพลาสมานิวเคลียร์ฟิวชั่นในทางปฏิบัติ

แบบจำลองตัวแทน AI เข้ามาแทนที่การจำลองทางฟิสิกส์ที่ช้า เพื่อสำรวจสถานการณ์พลาสมาอย่างรวดเร็วในระหว่างการวางแผนการทดลอง

แบบจำลองตัวแทน AI เข้ามาแทนที่การจำลองทางฟิสิกส์ที่ช้าเพื่อสำรวจสถานการณ์พลาสมาอย่างรวดเร็วระหว่างการวางแผนการทดลอง ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการผลิตที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การทำให้กระบวนการที่เสียหายเป็นอัตโนมัติสามารถขยายปัญหาที่มีอยู่ได้

!

ทีมอาจดำเนินการอัตโนมัติมากเกินไปและลบวิจารณญาณของมนุษย์ที่จำเป็นออก

!

คุณภาพอาจคลาดเคลื่อนได้หากไม่ได้รับการประเมินผลลัพธ์อย่างต่อเนื่อง

แผนงานการดำเนินงาน

1

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด

แมปขั้นตอนการทำงานปัจจุบันและระบุขั้นตอนที่มีแรงเสียดทานสูงสุด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ

กำหนดจุดตรวจของมนุษย์ก่อนระบบอัตโนมัติเต็มรูปแบบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ

ฝึกอบรมผู้ใช้เกี่ยวกับการแจ้งเตือน เส้นทางการยกระดับ และมาตรฐานคุณภาพ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน

ติดตามผลลัพธ์ระดับงานเพื่อยืนยันคุณค่าที่ยั่งยืน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป