คู่มือทางเทคนิค

AI และ SHAP ที่อธิบายได้

Explainable AI (XAI) เป็นชุดเครื่องมือสำหรับเปลี่ยนการทำนายที่ไม่ชัดเจนของโมเดลให้เป็นเหตุผลที่มนุษย์สามารถอ่านได้

ภาพรวม

Explainable AI (XAI) เป็นชุดเครื่องมือสำหรับเปลี่ยนการทำนายที่ไม่ชัดเจนของโมเดลให้เป็นเหตุผลที่มนุษย์สามารถอ่านได้ SHAP สร้างขึ้นจากทฤษฎีเกมแบบร่วมมือ เป็นวิธีการที่ใช้กันอย่างแพร่หลายที่สุดในการระบุแหล่งที่มาของการทำนายคุณลักษณะอินพุตแต่ละรายการอย่างยุติธรรม

AI และ SHAP ที่อธิบายได้คือองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง

เจาะลึก

โมเดลประสิทธิภาพสูงหลายตัว (ต้นไม้ที่มีการไล่ระดับ ตาข่ายลึก) เป็น 'กล่องดำ': แม่นยำแต่ยากต่อการซักถาม SHAP (คำอธิบายเพิ่มเติมของ SHapley) แนะนำโดย Scott Lundberg และ Su-In Lee ในปี 2560 ยืมคุณค่าของ Shapley จากทฤษฎีเกมแบบมีส่วนร่วม โดยจะถือว่าแต่ละฟีเจอร์เป็นเหมือน 'ผู้เล่น' และถามว่าฟีเจอร์นั้นมีส่วนช่วยในการย้ายการคาดการณ์ออกจากเส้นพื้นฐาน (เอาต์พุตโดยเฉลี่ย) มากน้อยเพียงใด ด้วยการหาค่าเฉลี่ยการมีส่วนร่วมส่วนเพิ่มของคุณลักษณะในการเรียงลำดับคุณลักษณะที่เป็นไปได้ทั้งหมด SHAP จะสร้างค่าที่มีความแม่นยำเฉพาะที่ (ซึ่งรวมเข้ากับการคาดการณ์) ความสม่ำเสมอ และการบวก ผลลัพธ์คือคำอธิบายต่อการคาดการณ์ ('รายได้เพิ่มคะแนนเงินกู้ของคุณ +0.12') บวกกับสรุปคุณลักษณะที่สำคัญทั่วโลก ทั้งหมดนี้เป็นไปตามพื้นฐานทางทฤษฎีที่มีร่วมกัน

ข้อมูลเชิงลึกทางเทคนิค

การคำนวณ Shapley ล้วนๆ เป็นแบบเอ็กซ์โปเนนเชียล โดยจะเฉลี่ยผลส่วนเพิ่มของจุดสนใจเหนือชุดย่อยของจุดสนใจอื่นๆ ทุกชุด SHAP ทำให้สิ่งนี้ใช้งานง่ายด้วยทางลัดเฉพาะรุ่น TreeSHAP คำนวณค่าที่แน่นอนสำหรับชุดต้นไม้ในเวลาพหุนามโดยการเดินตามโครงสร้างต้นไม้ KernelSHAP ประมาณการโมเดลใด ๆ ผ่านการถดถอยเชิงเส้นแบบถ่วงน้ำหนักบนอินพุตที่ถูกรบกวน DeepSHAP ปรับการกระจายกลับ ทั้งหมดมีการรับประกันเพิ่มเติมร่วมกัน: การคาดคะเนแต่ละครั้งจะเท่ากับเส้นพื้นฐานบวกกับผลรวมของค่า SHAP ของคุณลักษณะ

การเรียนรู้ AI และ SHAP ที่อธิบายได้

Explainable AI (XAI) เป็นชุดเครื่องมือสำหรับเปลี่ยนการทำนายที่ไม่ชัดเจนของโมเดลให้เป็นเหตุผลที่มนุษย์สามารถอ่านได้ SHAP สร้างขึ้นจากทฤษฎีเกมแบบร่วมมือ เป็นวิธีการที่ใช้กันอย่างแพร่หลายที่สุดในการระบุแหล่งที่มาของการทำนายคุณลักษณะอินพุตแต่ละรายการอย่างยุติธรรม AI และ SHAP ที่อธิบายได้คือองค์ประกอบทางเทคนิคที่ส่งผลต่อคุณภาพของโมเดล ต้นทุนโครงสร้างพื้นฐาน เวลาแฝง และความน่าเชื่อถือในวงกว้าง เพื่อสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่า Explainable AI และ SHAP เป็นรูปแบบการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Explainable AI และ SHAP จะปรับสถาปัตยกรรม ข้อมูล และตัวเลือกโครงสร้างพื้นฐานให้เหมาะสมโดยเทียบกับความน่าเชื่อถือและต้นทุน โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในเวลาเดียวกัน การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี

การตัดสินใจด้านสถาปัตยกรรมขับเคลื่อนประสิทธิภาพและต้นทุนการดำเนินงานเป็นเวลาหลายปี ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด

การศึกษาด้านเทคนิคช่วยให้ทีมเลือกกลุ่มที่เหมาะสม ไม่ใช่แค่กลุ่มใหม่ล่าสุด ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต

ตัวเลือกทางวิศวกรรมที่ดีกว่าจะช่วยลดเหตุการณ์ด้านความน่าเชื่อถือในการผลิต ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของ AI และ SHAP ที่อธิบายได้

XAI กำลังเปลี่ยนจากส่วนเสริมที่เป็นทางเลือกเป็นข้อกำหนดด้านกฎระเบียบ: พระราชบัญญัติ AI ของสหภาพยุโรปและกฎ "การกระทำที่ไม่พึงประสงค์" ทางการเงินต้องการคำอธิบายสำหรับการตัดสินใจที่มีความเสี่ยงสูง การวิจัยกำลังผลักดันไปสู่คำอธิบายที่ซื่อสัตย์ซึ่งสะท้อนถึงการใช้เหตุผลของแบบจำลองอย่างแท้จริงมากกว่าเรื่องราวที่ดูน่าเชื่อถือ และมุ่งไปสู่การอธิบายแบบจำลองภาษาขนาดใหญ่ ซึ่ง SHAP ระดับโทเค็นมีค่าใช้จ่ายสูง คาดว่าจะมีการบูรณาการการระบุแหล่งที่มาแบบ SHAP เข้ากับวิธีการเชิงสาเหตุ แดชบอร์ดเชิงโต้ตอบ และไปป์ไลน์การตรวจสอบที่ได้มาตรฐานมากขึ้น เพื่อให้ผู้ที่ไม่ใช่ผู้เชี่ยวชาญสามารถโต้แย้งการตัดสินใจอัตโนมัติได้

การใช้งานจริงในโลกแห่งความเป็นจริง

ธนาคารใช้ SHAP เพื่อสร้างเหตุผล 'การกระทำที่ไม่พึงประสงค์' ที่จำเป็นตามกฎหมายที่ทำให้สินเชื่อถูกปฏิเสธ โดยแสดงให้ผู้สมัครเห็นว่าปัจจัยใด (อัตราส่วนหนี้สินต่อรายได้ ความยาวประวัติเครดิต) เป็นตัวขับเคลื่อนการตัดสินใจ

แพทย์ตรวจสอบแผนบังคับของ SHAP ในแบบจำลองที่มีความเสี่ยงต่อภาวะติดเชื้อ เพื่อดูว่าสัญญาณชีพและค่าห้องปฏิบัติการใดที่ผลักดันให้ผู้ป่วยอยู่ในกลุ่มที่มีความเสี่ยงสูง ก่อนที่จะดำเนินการแจ้งเตือน

นักวิทยาศาสตร์ด้านข้อมูลใช้พล็อตสรุป SHAP (ผึ้งอุ่น) เพื่อตรวจจับว่าแบบจำลองการเลิกใช้งานกำลังเอนตัวอย่างหนักบนสนามข้อมูลในอนาคตที่รั่วไหล ซึ่งเผยให้เห็นการรั่วไหลของข้อมูล

บริษัทประกันภัยตรวจสอบโมเดลการกำหนดราคาด้วยแผนการพึ่งพา SHAP เพื่อตรวจสอบว่าพร็อกซีที่ได้รับการป้องกัน เช่น รหัสไปรษณีย์ มีอิทธิพลต่อพรีเมี่ยมอย่างไม่ยุติธรรมหรือไม่

รูปแบบการดำเนินงาน

AI และ SHAP ที่อธิบายได้ในทางปฏิบัติ

ธนาคารใช้ SHAP เพื่อสร้างเหตุผล 'การกระทำที่ไม่พึงประสงค์' ที่จำเป็นตามกฎหมายที่ทำให้สินเชื่อถูกปฏิเสธ โดยแสดงให้ผู้สมัครเห็นว่าปัจจัยใด (อัตราส่วนหนี้สินต่อรายได้ ความยาวประวัติเครดิต) เป็นตัวขับเคลื่อนการตัดสินใจ

ธนาคารใช้ SHAP เพื่อสร้างเหตุผล 'การกระทำที่ไม่พึงประสงค์' ที่จำเป็นตามกฎหมายที่สินเชื่อถูกปฏิเสธ แสดงให้ผู้สมัครเห็นว่าปัจจัยใด (หนี้สินต่อรายได้ ความยาวประวัติเครดิต) ผลักดันการตัดสินใจ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณีขอบ และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI และ SHAP ที่อธิบายได้ในทางปฏิบัติ

แพทย์ตรวจสอบแผนบังคับของ SHAP ในแบบจำลองที่มีความเสี่ยงต่อภาวะติดเชื้อ เพื่อดูว่าสัญญาณชีพและค่าห้องปฏิบัติการใดที่ผลักดันให้ผู้ป่วยอยู่ในกลุ่มที่มีความเสี่ยงสูง ก่อนที่จะดำเนินการแจ้งเตือน

แพทย์ตรวจสอบแผนบังคับของ SHAP บนแบบจำลองที่มีความเสี่ยงต่อการติดเชื้อเพื่อดูว่าสัญญาณชีพและค่าห้องปฏิบัติการใดที่ผลักดันผู้ป่วยให้อยู่ในประเภทที่มีความเสี่ยงสูงก่อนที่จะดำเนินการตามการแจ้งเตือน ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI และ SHAP ที่อธิบายได้ในทางปฏิบัติ

นักวิทยาศาสตร์ด้านข้อมูลใช้พล็อตสรุป SHAP (ผึ้งอุ่น) เพื่อตรวจจับว่าแบบจำลองการเลิกใช้งานกำลังเอนตัวอย่างหนักบนสนามข้อมูลในอนาคตที่รั่วไหล ซึ่งเผยให้เห็นการรั่วไหลของข้อมูล

นักวิทยาศาสตร์ด้านข้อมูลใช้พล็อตสรุป SHAP (ผึ้ง) เพื่อตรวจจับว่าแบบจำลองการเลิกใช้งานกำลังเอนเอียงอย่างหนักในฟิลด์ที่รั่วไหลในอนาคต ซึ่งเผยให้เห็นการรั่วไหลของข้อมูล ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

AI และ SHAP ที่อธิบายได้ในทางปฏิบัติ

บริษัทประกันภัยตรวจสอบโมเดลการกำหนดราคาด้วยแผนการพึ่งพา SHAP เพื่อตรวจสอบว่าพร็อกซีที่ได้รับการป้องกัน เช่น รหัสไปรษณีย์ มีอิทธิพลต่อพรีเมี่ยมอย่างไม่ยุติธรรมหรือไม่

บริษัทประกันภัยตรวจสอบโมเดลการกำหนดราคาด้วยแผนการพึ่งพา SHAP เพื่อตรวจสอบว่าพร็อกซีที่ได้รับการป้องกัน เช่น รหัสไปรษณีย์ มีอิทธิพลต่อพรีเมียมอย่างไม่ยุติธรรมหรือไม่ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

การเพิ่มประสิทธิภาพเกณฑ์มาตรฐานหนึ่งรายการสามารถซ่อนจุดอ่อนของระบบในวงกว้างได้

!

ต้นทุนโครงสร้างพื้นฐานและการบำรุงรักษามักถูกประเมินต่ำไป

!

ช่องว่างด้านความปลอดภัยและความสามารถในการสังเกตสามารถเพิ่มขึ้นได้เมื่อระบบมีความซับซ้อนมากขึ้น

แผนงานการดำเนินงาน

1

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน

กำหนดเป้าหมายเวลาแฝง คุณภาพ และต้นทุนก่อนนำไปใช้งาน ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง

เกณฑ์มาตรฐานภายใต้สภาวะโหลดและข้อมูลจริง ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้

การตรวจสอบเครื่องมือเพื่อหาข้อผิดพลาด การเบี่ยงเบน และผลกระทบต่อผู้ใช้ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด

เตรียมเส้นทางการย้อนกลับและการตอบสนองต่อเหตุการณ์ก่อนปรับขนาด ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป