ওভারভিউ
একটি ROC বক্ররেখা প্লট করে যে কতটা ভালোভাবে একটি শ্রেণীবিভাগকারী প্রতিটি সম্ভাব্য সিদ্ধান্তের থ্রেশহোল্ড জুড়ে দুটি শ্রেণীকে আলাদা করে, এবং AUC সেই পুরো বক্ররেখাটিকে একটি সংখ্যায় সংকুচিত করে। আপনি যেখানে কাটঅফ আঁকেন তার থেকে স্বাধীনভাবে তারা আপনাকে র্যাঙ্কিং গুণমানের কথা বলে।
ROC কার্ভস এবং AUC কোর AI টুলকিটে বসে। আপনি যখন এটি বুঝতে পারেন, তখন অন্যান্য AI বিষয়গুলি মূল্যায়ন এবং তুলনা করা সহজ হয়ে যায়।
গভীর ডুব
একটি রিসিভার অপারেটিং চারিত্রিক বৈশিষ্ট্য (আরওসি) বক্ররেখা সত্য ইতিবাচক হার (সংবেদনশীলতা, y-অক্ষের উপর) মিথ্যা ইতিবাচক হারের (এক্স-অক্ষে 1 বিয়োগ নির্দিষ্টতা, x-অক্ষে) এর বিপরীতে প্লট করে যখন আপনি শ্রেণীবিন্যাস থ্রেশহোল্ডকে 1 থেকে 0-তে স্লাইড করেন। প্রতিটি থ্রেশহোল্ড একটি পয়েন্ট দেয়; তাদের সংযোগ বক্ররেখা ট্রেস. একটি মডেল যা প্রতিটি ইতিবাচককে প্রতিটি নেতিবাচকের উপরে স্থান দেয় উপরের-বাম কোণে আলিঙ্গন করে। বক্ররেখার অধীনে এলাকা (AUC) এই রেখার নীচের মোট এলাকা পরিমাপ করে, 0.5 (এলোমেলো অনুমান, তির্যক) থেকে 1.0 (নিখুঁত) পর্যন্ত। একটি সহজ ব্যাখ্যা: AUC সম্ভাব্যতার সমান যে মডেলটি এলোমেলোভাবে নির্বাচিত নেতিবাচকের চেয়ে এলোমেলোভাবে নির্বাচিত ইতিবাচক স্কোর করে। শব্দটি দ্বিতীয় বিশ্বযুদ্ধের রাডার অপারেটরদের থেকে এসেছে যা গোলমাল থেকে সংকেতকে আলাদা করে।
প্রযুক্তিগত অন্তর্দৃষ্টি
AUC থ্রেশহোল্ড-স্বাধীন কারণ এটি সমস্ত কাটঅফের উপর পারফরম্যান্সকে একীভূত করে, তাই আপনি যেখানে সিদ্ধান্তের সীমানা সেট করেছেন তাতে এটি প্রভাবিত হয় না। এটি গাণিতিকভাবে মান-হুইটনি ইউ পরিসংখ্যান এবং উইলকক্সন র্যাঙ্ক-সম পরীক্ষার সমতুল্য, যার অর্থ এটি শুধুমাত্র ভবিষ্যদ্বাণীকৃত স্কোরগুলির ক্রমক্রমের উপর নির্ভর করে, তাদের পরম মান নয়। এটি একঘেয়ে স্কোর রূপান্তরের অধীনে এটিকে স্থিতিশীল করে তোলে তবে ক্রমাঙ্কনের প্রতিও সংবেদনশীল নয়: একটি ভাল র্যাঙ্কযুক্ত কিন্তু খারাপভাবে ক্যালিব্রেট করা মডেল এখনও একটি উচ্চ AUC স্কোর করতে পারে।
ROC কার্ভ এবং AUC আয়ত্ত করা
একটি ROC বক্ররেখা প্লট করে যে কতটা ভালোভাবে একটি শ্রেণীবিভাগকারী প্রতিটি সম্ভাব্য সিদ্ধান্তের থ্রেশহোল্ড জুড়ে দুটি শ্রেণীকে আলাদা করে, এবং AUC সেই পুরো বক্ররেখাটিকে একটি সংখ্যায় সংকুচিত করে। আপনি যেখানে কাটঅফ আঁকেন তার থেকে স্বাধীনভাবে তারা আপনাকে র্যাঙ্কিং গুণমানের কথা বলে। ROC কার্ভস এবং AUC কোর AI টুলকিটে বসে। আপনি যখন এটি বুঝতে পারেন, তখন অন্যান্য AI বিষয়গুলি মূল্যায়ন এবং তুলনা করা সহজ হয়ে যায়। গভীর বোঝাপড়া তৈরি করতে, ROC Curves এবং AUC কে একটি অপারেটিং মডেল হিসাবে বিবেচনা করুন, একটি একক বৈশিষ্ট্য নয়: পছন্দসই ফলাফলগুলি সংজ্ঞায়িত করুন, অনুমানগুলি স্পষ্ট করুন এবং সিস্টেমটি নির্ভরযোগ্যভাবে কী করতে পারে তা এখনও বিশেষজ্ঞের রায়ের প্রয়োজন থেকে আলাদা করুন৷
অনুশীলনে, ROC কার্ভস এবং AUC ব্যবহার করে শক্তিশালী দলগুলি প্রথমে শক্তিশালী ধারণাগত মডেল তৈরি করে, তারপর সেই মডেলগুলিকে প্রকৃত উত্পাদন সীমাবদ্ধতার সাথে মানচিত্র করে। তারা সুস্পষ্ট সাফল্যের মাপকাঠি নথিভুক্ত করে, বাস্তবসম্মত ডেটা এবং কর্মপ্রবাহের বিরুদ্ধে পরীক্ষা করে এবং এককালীন বেঞ্চমার্ক জয়ের পরিবর্তে পর্যবেক্ষিত ব্যর্থতার ধরণগুলির উপর ভিত্তি করে পুনরাবৃত্তি করে। এখানেই তাত্ত্বিক বোঝাপড়া পণ্য, নীতি এবং অপারেশন জুড়ে টেকসই সক্ষমতায় পরিণত হয়।
এটি আপনাকে বিপণনের ভাষা থেকে স্পষ্ট প্রযুক্তিগত দাবিগুলি আলাদা করতে সহায়তা করে। একই সময়ে, বিভিন্ন দল একই শব্দটি ভিন্নভাবে ব্যবহার করতে পারে, তাই সুযোগটি প্রথম দিকে সংজ্ঞায়িত করুন। সবচেয়ে স্থিতিস্থাপক পদ্ধতি হল প্রশাসনিক শৃঙ্খলার সাথে পরীক্ষার গতিকে একত্রিত করা: পাইলট চালান, প্রমাণ ক্যাপচার করুন, সিদ্ধান্তের লগ প্রকাশ করুন এবং মডেল আচরণ, ব্যবহারকারীর প্রত্যাশা এবং নিয়ন্ত্রক প্রয়োজনীয়তাগুলি বিকশিত হওয়ার সাথে সাথে অবিচ্ছিন্ন সুরক্ষাগুলি আপডেট করুন।
কৌশলগত প্রভাব
এটি আপনাকে বিপণনের ভাষা থেকে স্পষ্ট প্রযুক্তিগত দাবিগুলি আলাদা করতে সহায়তা করে।
এটি আপনাকে বিপণনের ভাষা থেকে স্পষ্ট প্রযুক্তিগত দাবিগুলি আলাদা করতে সহায়তা করে। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।
অর্থ বা সময় ব্যয় করার আগে আপনি আরও ভাল বাস্তবায়ন প্রশ্ন জিজ্ঞাসা করতে পারেন।
অর্থ বা সময় ব্যয় করার আগে আপনি আরও ভাল বাস্তবায়ন প্রশ্ন জিজ্ঞাসা করতে পারেন। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।
ভাগ করা বোঝাপড়া সহ দলগুলি আরও ভাল পণ্য, নীতি এবং শেখার সিদ্ধান্ত নেয়।
ভাগ করা বোঝাপড়া সহ দলগুলি আরও ভাল পণ্য, নীতি এবং শেখার সিদ্ধান্ত নেয়। উচ্চ-মানের স্থাপনায়, এটি পরিমাপযোগ্য অপারেটিং নিয়ম, মালিকানার সীমানা এবং পুনরাবৃত্ত পর্যালোচনার আচার-অনুষ্ঠানে অনুবাদ করা হয় যাতে দলগুলি অস্পষ্টতার পরিবর্তে আত্মবিশ্বাস বাড়াতে পারে।
বাস্তব-বিশ্ব বাস্তবায়ন
একটি ব্যাঙ্কের AUC দ্বারা দুটি জালিয়াতি-সনাক্তকরণ মডেলের তুলনা করে এমন একটি বেছে নেওয়া যা জালিয়াতিপূর্ণ লেনদেনকে বৈধ লেনদেনের উপরে সেরা স্থান দেয়
একটি রোগের জন্য একটি ডায়াগনস্টিক পরীক্ষার মূল্যায়ন করা (যেমন, একটি ক্যান্সার স্ক্রীনিং ক্লাসিফায়ার) যেখানে রেডিওলজিস্টদের মিথ্যা অ্যালার্মের বিরুদ্ধে আরও বেশি কেস ধরার ব্যবসা করতে হবে
মিথ্যা ইতিবাচক (বৈধ মেইলকে স্প্যাম হিসাবে পতাকাঙ্কিত) খুব কম রাখতে ROC বক্ররেখা ব্যবহার করে একটি স্প্যাম ফিল্টারের থ্রেশহোল্ড টিউন করা
একটি ক্রেডিট-ডিফল্ট স্কোরিং মডেলের মানদণ্ড যেখানে AUC সংক্ষিপ্ত করে যে এটি ঋণগ্রহীতাদের যারা ডিফল্ট তাদের থেকে পরিশোধ করে তাদের কতটা ভালোভাবে আলাদা করে
বাস্তবায়ন নিদর্শন
অনুশীলনে ROC কার্ভ এবং AUC
একটি ব্যাঙ্কের AUC দ্বারা দুটি জালিয়াতি-সনাক্তকরণ মডেলের তুলনা করে এমন একটি বেছে নেওয়া যা জালিয়াতিমূলক লেনদেনকে বৈধ লেনদেনের উপরে সেরা স্থান দেয়।
একটি ব্যাঙ্কের জন্য তাদের AUC দ্বারা দুটি জালিয়াতি-সনাক্তকরণ মডেলের তুলনা করে এমন একটি বাছাই করা যা প্রতারণামূলক লেনদেনগুলিকে বৈধগুলির উপরে সেরা র্যাঙ্ক করে দলগুলি সাধারণত আরও ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে৷
অনুশীলনে ROC কার্ভ এবং AUC
একটি রোগের জন্য একটি ডায়াগনস্টিক পরীক্ষার মূল্যায়ন করা (যেমন, একটি ক্যান্সার স্ক্রীনিং ক্লাসিফায়ার) যেখানে রেডিওলজিস্টদের মিথ্যা অ্যালার্মের বিরুদ্ধে আরও বেশি কেস ধরা বন্ধ করতে হবে।
একটি রোগের জন্য একটি ডায়াগনস্টিক পরীক্ষার মূল্যায়ন করা (যেমন, একটি ক্যান্সার স্ক্রীনিং ক্লাসিফায়ার) যেখানে রেডিওলজিস্টদের মিথ্যা অ্যালার্মের বিরুদ্ধে আরও বেশি কেস ধরার জন্য ট্রেড করতে হয় দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে মানুষের বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে৷
অনুশীলনে ROC কার্ভ এবং AUC
একটি স্প্যাম ফিল্টারের থ্রেশহোল্ড টিউনিং ROC বক্ররেখা ব্যবহার করে মিথ্যা ইতিবাচক (বৈধ মেল স্প্যাম হিসাবে পতাকাঙ্কিত) খুব কম রাখতে।
একটি স্প্যাম ফিল্টারের থ্রেশহোল্ড টিউনিং ROC বক্ররেখা ব্যবহার করে মিথ্যা ইতিবাচক (বৈধ মেল স্প্যাম হিসাবে পতাকাঙ্কিত) খুব কম রাখা দলগুলি সাধারণত ভাল ফলাফল পায় যখন তারা সামনের মানের থ্রেশহোল্ডগুলিকে সংজ্ঞায়িত করে, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে৷
অনুশীলনে ROC কার্ভ এবং AUC
একটি ক্রেডিট-ডিফল্ট স্কোরিং মডেলের মানদণ্ড যেখানে AUC সংক্ষিপ্ত করে যে এটি ঋণগ্রহীতাদের যারা ডিফল্ট তাদের থেকে পরিশোধ করে তাদের কতটা ভালোভাবে আলাদা করে।
একটি ক্রেডিট-ডিফল্ট স্কোরিং মডেলের বেঞ্চমার্কিং যেখানে AUC সংক্ষিপ্ত করে যে এটি ঋণগ্রহীতাদেরকে কতটা ভালোভাবে আলাদা করে যারা ডিফল্ট দলগুলি তাদের থেকে ফেরত দেয় যখন তারা মানের থ্রেশহোল্ড সামনের দিকে সংজ্ঞায়িত করে তখন আরও ভাল ফলাফল পায়, প্রান্তের ক্ষেত্রে একটি মানবিক বৃদ্ধির পথ রাখে এবং সময়ের সাথে সাথে উত্পাদনশীলতা লাভ এবং ত্রুটির খরচ উভয়ই ট্র্যাক করে।
ঝুঁকি এবং প্রহরী
বিভিন্ন দল একই শব্দটি ভিন্নভাবে ব্যবহার করতে পারে, তাই সুযোগটি আগে থেকেই নির্ধারণ করুন।
বেঞ্চমার্কগুলি শক্তিশালী দেখাতে পারে যখন বাস্তব-বিশ্বের কর্মক্ষমতা অসম হয়।
ডেটা গুণমান এবং মূল্যায়ন পরিকল্পনা উপেক্ষা করা প্রায়ই ভঙ্গুর ফলাফল তৈরি করে।
বাস্তবায়ন রোডম্যাপ
আপনার প্রয়োজনীয় ফলাফলের একটি সরল-ভাষা সংজ্ঞা দিয়ে শুরু করুন।
আপনার প্রয়োজনীয় ফলাফলের একটি সরল-ভাষা সংজ্ঞা দিয়ে শুরু করুন। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।
পরীক্ষার আগে একটি সাফল্যের মেট্রিক এবং একটি ব্যর্থতার শর্ত বাছুন।
পরীক্ষার আগে একটি সাফল্যের মেট্রিক এবং একটি ব্যর্থতার শর্ত বাছুন। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।
একটি পালিশ ডেমো সেট নয়, প্রতিনিধি ডেটা সহ একটি ছোট পাইলট চালান৷
একটি পালিশ ডেমো সেট নয়, প্রতিনিধি ডেটা সহ একটি ছোট পাইলট চালান৷ প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।
নথি যেখানে ROC কার্ভ এবং AUC সাহায্য করে এবং যেখানে সহজ পদ্ধতিগুলি ভাল।
নথি যেখানে ROC কার্ভ এবং AUC সাহায্য করে এবং যেখানে সহজ পদ্ধতিগুলি ভাল। প্রতিটি পদক্ষেপকে একটি প্রমাণ গেট হিসাবে বিবেচনা করুন: যদি মানদণ্ড পূরণ না হয়, রোলআউট থামান, ব্যবধান বন্ধ করুন এবং শুধুমাত্র তারপর ব্যবহার প্রসারিত করুন।