คู่มือพื้นฐาน

การตรวจจับความผิดปกติ

การตรวจจับความผิดปกติเป็นการฝึกสอนเครื่องจักรให้ระบุจุดข้อมูลที่เบี่ยงเบนไปจากรูปแบบปกติอย่างมาก

ภาพรวม

การตรวจจับความผิดปกติเป็นการฝึกสอนเครื่องจักรให้ระบุจุดข้อมูลที่เบี่ยงเบนไปจากรูปแบบปกติอย่างมาก เรื่องนี้สำคัญเนื่องจากเหตุการณ์ที่ไม่คาดคิดและเกิดขึ้นไม่บ่อยนัก เช่น การฉ้อโกง อุปกรณ์ขัดข้อง การบุกรุก มักจะซ่อนอยู่ในมหาสมุทรของข้อมูลประจำที่มนุษย์ไม่สามารถสแกนด้วยมือได้

การตรวจจับความผิดปกติอยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น

เจาะลึก

การตรวจจับความผิดปกติจะระบุการสังเกตที่ไม่สอดคล้องกับพฤติกรรมที่คาดหวัง ซึ่งมักเรียกว่าค่าผิดปกติ สิ่งใหม่ หรือข้อยกเว้น วิธีการส่วนใหญ่เรียนรู้ก่อนว่า 'ปกติ' มีลักษณะอย่างไร จากนั้นจึงให้คะแนนข้อมูลใหม่ตามระยะที่มันหลงทาง วิธีการทางสถิติชี้ว่ามีค่าเกินกว่าค่าเบี่ยงเบนมาตรฐานเล็กน้อย วิธีการที่ใช้ระยะทาง เช่น เพื่อนบ้านที่ใกล้ที่สุด k ชี้ให้ไกลจากเพื่อน วิธีความหนาแน่น เช่น ค่าสถานะค่านอกเหนือท้องถิ่นจะชี้ให้เห็นในพื้นที่กระจัดกระจาย การเรียนรู้ของเครื่องได้เพิ่ม Isolation Forests ซึ่งใช้ประโยชน์จากข้อเท็จจริงที่ว่าความผิดปกตินั้นง่ายต่อการแยกโดยมีการสุ่มแยกเพียงเล็กน้อย และตัวเข้ารหัสอัตโนมัติ ซึ่งสร้างข้อมูลปกติขึ้นมาใหม่ได้ดีแต่ล้มเหลวในสิ่งผิดปกติ ความท้าทายหลักคือความผิดปกตินั้นหาได้ยากและมักไม่มีป้ายกำกับ ดังนั้นแบบจำลองจึงต้องเรียนรู้เป็นส่วนใหญ่จากตัวอย่างปกติ และยอมรับคำจำกัดความที่คลุมเครือและเปลี่ยนแปลงไปของคำว่า 'ปกติ'

ข้อมูลเชิงลึกทางเทคนิค

ระบบจำนวนมากได้รับการฝึกอบรมเฉพาะกับข้อมูลปกติเท่านั้น — ที่เรียกว่าการเรียนรู้แบบชั้นเดียวหรือกึ่งภายใต้การดูแล — เนื่องจากความผิดปกติที่มีป้ายกำกับนั้นพบได้น้อยมาก ตัวอย่างเช่นโปรแกรมเข้ารหัสอัตโนมัติจะบีบอัดอินพุตให้อยู่ในคอขวดเล็กๆ แล้วสร้างใหม่ เมื่อฝึกกับตัวอย่างปกติ ทำให้เกิดข้อผิดพลาดในการประกอบขึ้นใหม่สูงกับความผิดปกติที่ไม่เคยพบเห็นมาก่อน Isolation Forests ทำงานแตกต่างออกไป: การแบ่งพาร์ติชั่นแบบสุ่มจะแยกค่าผิดปกติออกด้วยการแยกที่น้อยลง ดังนั้นความยาวเส้นทางเฉลี่ยที่สั้นกว่าจึงส่งสัญญาณถึงความผิดปกติ ทั้งสองแปลง 'ความแปลกประหลาด' ให้เป็นคะแนนตัวเลขพร้อมเกณฑ์

การเรียนรู้การตรวจจับความผิดปกติ

การตรวจจับความผิดปกติเป็นการฝึกสอนเครื่องจักรให้ระบุจุดข้อมูลที่เบี่ยงเบนไปจากรูปแบบปกติอย่างมาก เรื่องนี้สำคัญเนื่องจากเหตุการณ์ที่ไม่คาดคิดและเกิดขึ้นไม่บ่อยนัก เช่น การฉ้อโกง อุปกรณ์ขัดข้อง การบุกรุก มักจะซ่อนอยู่ในมหาสมุทรของข้อมูลประจำที่มนุษย์ไม่สามารถสแกนด้วยมือได้ การตรวจจับความผิดปกติอยู่ในชุดเครื่องมือ AI หลัก เมื่อคุณเข้าใจ หัวข้อ AI อื่นๆ จะประเมินและเปรียบเทียบได้ง่ายขึ้น หากต้องการสร้างความเข้าใจอย่างลึกซึ้ง ให้ถือว่าการตรวจจับความผิดปกติเป็นเพียงโมเดลการดำเนินงาน ไม่ใช่คุณลักษณะเดียว: กำหนดผลลัพธ์ที่ต้องการ ชี้แจงสมมติฐาน และแยกสิ่งที่ระบบสามารถทำได้อย่างน่าเชื่อถือจากสิ่งที่ยังต้องใช้วิจารณญาณจากผู้เชี่ยวชาญ

ในทางปฏิบัติ ทีมที่แข็งแกร่งที่ใช้ Anomaly Detection จะสร้างโมเดลเชิงแนวคิดที่แข็งแกร่งก่อน จากนั้นจึงจับคู่โมเดลเหล่านั้นกับข้อจำกัดในการใช้งานจริง โดยจะบันทึกเกณฑ์ความสำเร็จที่ชัดเจน ทดสอบกับข้อมูลและขั้นตอนการทำงานที่สมจริง และทำซ้ำตามรูปแบบความล้มเหลวที่สังเกตได้ แทนที่จะชนะการวัดประสิทธิภาพเพียงครั้งเดียว นี่คือจุดที่ความเข้าใจทางทฤษฎีกลายเป็นความสามารถที่คงทนของผลิตภัณฑ์ นโยบาย และการดำเนินงาน

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในเวลาเดียวกัน ทีมต่างๆ อาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ แนวทางที่ยืดหยุ่นที่สุดคือการรวมความเร็วของการทดลองเข้ากับวินัยในการกำกับดูแล: ดำเนินการนำร่อง จับหลักฐาน เผยแพร่บันทึกการตัดสินใจ และอัปเดตการป้องกันอย่างต่อเนื่องเมื่อพฤติกรรมของโมเดล ความคาดหวังของผู้ใช้ และข้อกำหนดด้านกฎระเบียบมีการเปลี่ยนแปลง

ผลกระทบเชิงกลยุทธ์

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้

ช่วยให้คุณแยกคำกล่าวอ้างทางเทคนิคที่ชัดเจนออกจากภาษาทางการตลาดได้ ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา

คุณสามารถถามคำถามการใช้งานที่ดีขึ้นก่อนที่จะใช้เงินหรือเวลา ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น

ทีมที่มีความเข้าใจร่วมกันจะตัดสินใจเกี่ยวกับผลิตภัณฑ์ นโยบาย และการเรียนรู้ได้ดีขึ้น ในการปรับใช้คุณภาพสูง สิ่งนี้จะถูกแปลเป็นกฎการปฏิบัติงานที่วัดผลได้ ขอบเขตความเป็นเจ้าของ และขั้นตอนการตรวจสอบที่เกิดซ้ำ เพื่อให้ทีมสามารถปรับขนาดความมั่นใจแทนที่จะปรับขนาดความคลุมเครือ

อนาคตของการตรวจจับความผิดปกติ

การตรวจจับกำลังเคลื่อนไปสู่การสตรีมแบบเรียลไทม์บนอุปกรณ์ Edge ดังนั้นความผิดปกติจึงปรากฏขึ้นภายในเสี้ยววินาที แทนที่จะปรากฏหลังการวิเคราะห์เป็นชุด การเรียนรู้เชิงลึกและโครงข่ายประสาทเทียมแบบกราฟจับรูปแบบที่ละเอียดอ่อนและหลายตัวแปรได้มากขึ้น เช่น วงแหวนการฉ้อโกงที่ประสานกัน โมเดลแบบมีการดูแลตนเองและแบบพื้นฐานรับประกันว่าระบบจะปรับตามการเลื่อน 'ปกติ' เมื่อเวลาผ่านไป ซึ่งช่วยลดการปรับจูนใหม่ด้วยตนเอง ความสามารถในการอธิบายก็เป็นสิ่งสำคัญเช่นกัน ทีมต้องการแบบจำลองที่ไม่เพียงแต่บอกว่ามีบางอย่างผิดปกติ แต่ฟีเจอร์ใดที่ทำให้เกิดการแจ้งเตือน เพื่อให้นักวิเคราะห์สามารถดำเนินการด้วยความมั่นใจ

การใช้งานจริงในโลกแห่งความเป็นจริง

เครือข่ายบัตรเครดิตทำเครื่องหมายการทำธุรกรรมในต่างประเทศเพียงไม่กี่วินาทีหลังจากมีการใช้บัตรในประเทศ ระงับการฉ้อโกงก่อนซื้อ

เซ็นเซอร์จากโรงงานตรวจจับการสั่นสะเทือนหรืออุณหภูมิที่ผิดปกติในมอเตอร์ โดยคาดการณ์ความล้มเหลวของตลับลูกปืนหลายวันก่อนที่ความเสียหายจะหยุดสายการผลิต

เครื่องมือรักษาความปลอดภัยทางไซเบอร์ตรวจพบว่าเซิร์ฟเวอร์ส่งกิกะไบต์ไปยัง IP ที่ไม่รู้จักอย่างกะทันหันในเวลาตี 3 ซึ่งเป็นสัญญาณบ่งชี้ว่าอาจมีการขโมยข้อมูลได้

เครื่องติดตามของโรงพยาบาลจับจังหวะการเต้นของหัวใจที่ไม่สม่ำเสมอในข้อมูล ECG อย่างต่อเนื่อง เพื่อแจ้งเตือนแพทย์ถึงภาวะหัวใจเต้นผิดจังหวะที่กำลังพัฒนา

รูปแบบการดำเนินงาน

การตรวจจับความผิดปกติในทางปฏิบัติ

เครือข่ายบัตรเครดิตทำเครื่องหมายการทำธุรกรรมในต่างประเทศเพียงไม่กี่วินาทีหลังจากมีการใช้บัตรในประเทศ ระงับการฉ้อโกงก่อนซื้อ

เครือข่ายบัตรเครดิตจะทำเครื่องหมายธุรกรรมในต่างประเทศไม่กี่วินาทีหลังจากใช้บัตรในประเทศ การระงับการฉ้อโกงที่อาจเกิดขึ้นก่อนซื้อ ทีมมักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การตรวจจับความผิดปกติในทางปฏิบัติ

เซ็นเซอร์จากโรงงานตรวจจับการสั่นสะเทือนหรืออุณหภูมิที่ผิดปกติในมอเตอร์ โดยคาดการณ์ความล้มเหลวของตลับลูกปืนหลายวันก่อนที่ความเสียหายจะหยุดสายการผลิต

เซ็นเซอร์จากโรงงานตรวจจับการสั่นสะเทือนหรืออุณหภูมิที่ผิดปกติในมอเตอร์ โดยคาดการณ์ความล้มเหลวของตลับลูกปืนหลายวันก่อนที่ระบบจะหยุดทำงานในสายการผลิต ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณีขอบ และติดตามทั้งการเพิ่มผลผลิตและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การตรวจจับความผิดปกติในทางปฏิบัติ

เครื่องมือรักษาความปลอดภัยทางไซเบอร์ตรวจพบว่าเซิร์ฟเวอร์ส่งกิกะไบต์ไปยัง IP ที่ไม่รู้จักอย่างกะทันหันในเวลาตี 3 ซึ่งเป็นสัญญาณบ่งชี้ว่าอาจมีการขโมยข้อมูลได้

เครื่องมือรักษาความปลอดภัยทางไซเบอร์ตรวจพบว่าเซิร์ฟเวอร์ส่งกิกะไบต์ไปยัง IP ที่ไม่รู้จักอย่างกะทันหันในเวลาตี 3 ซึ่งเป็นการส่งสัญญาณว่าทีมขโมยข้อมูลที่เป็นไปได้มักจะได้รับผลลัพธ์ที่ดีกว่าเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับโดยมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

การตรวจจับความผิดปกติในทางปฏิบัติ

เครื่องติดตามของโรงพยาบาลจับจังหวะการเต้นของหัวใจที่ไม่สม่ำเสมอในข้อมูล ECG อย่างต่อเนื่อง เพื่อแจ้งเตือนแพทย์ถึงภาวะหัวใจเต้นผิดจังหวะที่กำลังพัฒนา

เครื่องติดตามของโรงพยาบาลจับจังหวะการเต้นของหัวใจที่ไม่สม่ำเสมอในข้อมูล ECG อย่างต่อเนื่อง แจ้งเตือนแพทย์ถึงภาวะหัวใจเต้นผิดจังหวะที่กำลังพัฒนา ทีมมักจะได้รับผลลัพธ์ที่ดีขึ้นเมื่อพวกเขากำหนดเกณฑ์คุณภาพล่วงหน้า รักษาเส้นทางการยกระดับของมนุษย์สำหรับกรณี Edge และติดตามทั้งประสิทธิภาพการทำงานที่เพิ่มขึ้นและต้นทุนข้อผิดพลาดเมื่อเวลาผ่านไป

ความเสี่ยงและรั้ว

!

แต่ละทีมอาจใช้คำเดียวกันต่างกัน ดังนั้นควรกำหนดขอบเขตตั้งแต่เนิ่นๆ

!

เกณฑ์มาตรฐานอาจดูแข็งแกร่งในขณะที่ประสิทธิภาพในโลกแห่งความเป็นจริงไม่เท่ากัน

!

การเพิกเฉยต่อคุณภาพข้อมูลและแผนการประเมินมักสร้างผลลัพธ์ที่เปราะบาง

แผนงานการดำเนินงาน

1

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ

เริ่มต้นด้วยคำจำกัดความภาษาธรรมดาของผลลัพธ์ที่คุณต้องการ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

2

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ

เลือกเมตริกวัดความสำเร็จหนึ่งรายการและเงื่อนไขความล้มเหลวหนึ่งรายการก่อนการทดสอบ ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

3

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม

ดำเนินการนำร่องขนาดเล็กด้วยข้อมูลตัวแทน ไม่ใช่ชุดสาธิตที่สวยงาม ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

4

เอกสารที่การตรวจจับความผิดปกติช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า

เอกสารที่การตรวจจับความผิดปกติช่วยได้ และวิธีที่ง่ายกว่าจะดีกว่า ถือว่าแต่ละขั้นตอนเป็นเหมือนประตูหลักฐาน: หากไม่ตรงตามเกณฑ์ ให้หยุดการเปิดตัวชั่วคราว ปิดช่องว่าง จากนั้นจึงขยายการใช้งานเท่านั้น

สำรวจต่อไป