PANDUAN Asas

Ketepatan dan Ingat

Ketepatan dan ingat semula ialah dua metrik pelengkap untuk menilai pengelas, terutamanya apabila kelas tidak seimbang.

Gambaran keseluruhan

Ketepatan dan ingat semula ialah dua metrik pelengkap untuk menilai pengelas, terutamanya apabila kelas tidak seimbang. Bersama-sama mereka mendedahkan perkara yang disembunyikan oleh ketepatan biasa — berapa kerap ramalan positif model adalah betul dan berapa banyak positif sebenar yang sebenarnya diperolehi.

Precision dan Recall terletak dalam kit alat AI teras. Apabila anda memahaminya, topik AI lain menjadi lebih mudah untuk dinilai dan dibandingkan.

Menyelam dalam

Apabila model menandakan item sebagai positif, dua soalan penting. Ketepatan bertanya: daripada semua yang kami tandakan, berapa banyak yang benar-benar positif? Ia sama dengan positif benar dibahagikan dengan semua positif yang diramalkan, menghukum penggera palsu. Ingat (kepekaan) bertanya: daripada semua positif sebenar di luar sana, berapa banyak yang kita tangkap? Ia sama dengan positif sebenar dibahagikan dengan semua positif sebenar, menghukum tersasar. Ini biasanya bertukar ganti: menurunkan ambang keputusan menangkap lebih banyak positif (ingat lebih tinggi) tetapi menandakan lebih banyak sampah (ketepatan lebih rendah), dan sebaliknya. Yang perlu diutamakan bergantung pada kos — penapis spam mengutamakan ketepatan (jangan buang mel sebenar), manakala skrin kanser lebih suka mengingat kembali (jangan terlepas tumor). Skor F1, min harmoniknya, mengimbangi kedua-duanya dalam satu nombor.

Wawasan Teknikal

Kedua-dua metrik datang daripada positif sebenar (TP) matriks kekeliruan, positif palsu (FP) dan negatif palsu (FN): Precision = TP / (TP + FP), Recall = TP / (TP + FN). Terutamanya, kedua-duanya tidak menggunakan negatif sebenar, itulah sebabnya mereka kekal bermaklumat apabila negatif jauh lebih banyak daripada positif. Menyapu ambang pengelasan mengesan keluk ingat-ingat ketepatan; kawasan di bawahnya (purata ketepatan) meringkaskan prestasi dan lebih disukai berbanding ROC-AUC pada data yang sangat tidak seimbang.

Menguasai Ketepatan dan Ingat

Ketepatan dan ingat semula ialah dua metrik pelengkap untuk menilai pengelas, terutamanya apabila kelas tidak seimbang. Bersama-sama mereka mendedahkan perkara yang disembunyikan oleh ketepatan biasa — berapa kerap ramalan positif model adalah betul dan berapa banyak positif sebenar yang sebenarnya diperolehi. Precision dan Recall terletak dalam kit alat AI teras. Apabila anda memahaminya, topik AI lain menjadi lebih mudah untuk dinilai dan dibandingkan. Untuk membina pemahaman yang mendalam, layan Precision dan Recall sebagai model pengendalian, bukan satu ciri: tentukan hasil yang diingini, jelaskan andaian dan pisahkan perkara yang boleh dilakukan oleh sistem dengan pasti daripada perkara yang masih memerlukan pertimbangan pakar.

Dalam amalan, pasukan kuat yang menggunakan Precision dan Recall membina model konseptual yang kukuh dahulu, kemudian memetakan model tersebut kepada kekangan pengeluaran sebenar. Mereka mendokumentasikan kriteria kejayaan yang jelas, menguji terhadap data dan aliran kerja yang realistik, dan mengulang berdasarkan corak kegagalan yang diperhatikan dan bukannya kemenangan penanda aras sekali. Di sinilah pemahaman teori bertukar menjadi keupayaan tahan lama merentas produk, dasar dan operasi.

Ia membantu anda memisahkan tuntutan teknikal yang jelas daripada bahasa pemasaran. Pada masa yang sama, Pasukan yang berbeza mungkin menggunakan istilah yang sama secara berbeza, jadi tentukan skop lebih awal. Pendekatan yang paling berdaya tahan adalah untuk menggabungkan kelajuan percubaan dengan disiplin tadbir urus: menjalankan juruterbang, menangkap bukti, menerbitkan log keputusan dan sentiasa mengemas kini perlindungan apabila tingkah laku model, jangkaan pengguna dan keperluan kawal selia berkembang.

Kesan Strategik

Ia membantu anda memisahkan tuntutan teknikal yang jelas daripada bahasa pemasaran.

Ia membantu anda memisahkan tuntutan teknikal yang jelas daripada bahasa pemasaran. Dalam penempatan berkualiti tinggi, ini diterjemahkan kepada peraturan operasi yang boleh diukur, sempadan pemilikan dan ritual semakan berulang supaya pasukan dapat mengukur keyakinan dan bukannya menskalakan kekaburan.

Anda boleh bertanya soalan pelaksanaan yang lebih baik sebelum menghabiskan wang atau masa.

Anda boleh bertanya soalan pelaksanaan yang lebih baik sebelum menghabiskan wang atau masa. Dalam penempatan berkualiti tinggi, ini diterjemahkan kepada peraturan operasi yang boleh diukur, sempadan pemilikan dan ritual semakan berulang supaya pasukan dapat mengukur keyakinan dan bukannya menskalakan kekaburan.

Pasukan yang berkongsi pemahaman membuat keputusan produk, dasar dan pembelajaran yang lebih baik.

Pasukan yang berkongsi pemahaman membuat keputusan produk, dasar dan pembelajaran yang lebih baik. Dalam penempatan berkualiti tinggi, ini diterjemahkan kepada peraturan operasi yang boleh diukur, sempadan pemilikan dan ritual semakan berulang supaya pasukan dapat mengukur keyakinan dan bukannya menskalakan kekaburan.

Masa Depan Ketepatan dan Ingatan

Memandangkan AI memasuki domain berkepentingan tinggi - diagnosis perubatan, penyederhanaan kandungan, penipuan - pasukan semakin melaporkan ketepatan dan ingatan (dan lengkung mereka) berbanding ketepatan sahaja, dan menyesuaikan ambang untuk memadankan kos dunia sebenar dan kekangan keadilan. Audit ketepatan/panggil balik setiap kumpulan menjadi standard untuk mengesan kadar ralat yang berbeza merentas demografi. Jangkakan metrik sensitif kos yang lebih kaya, kebarangkalian yang ditentukur dan alatan yang membolehkan pihak berkepentingan memilih titik operasi secara interaktif dan bukannya menerima ambang lalai 0.5.

Pelaksanaan Dunia Sebenar

Penapis spam menala untuk ketepatan tinggi supaya e-mel yang sah hampir tidak pernah tersalah hantar ke folder spam.

Ujian saringan perubatan mengutamakan ingatan tinggi untuk mengelakkan kehilangan pesakit yang sebenarnya menghidap penyakit itu, menerima lebih banyak positif palsu untuk susulan.

Sistem carian dan pengesyoran melaporkan precision@k (berapa banyak hasil k teratas yang berkaitan) untuk mengukur kualiti kedudukan.

Pengesanan penipuan mengimbangi ketepatan dan penarikan balik melalui skor F1, kerana kedua-dua penggera palsu dan penipuan terlepas adalah mahal.

Corak Pelaksanaan

Ketepatan dan Ingat dalam amalan

Penapis spam menala untuk ketepatan tinggi supaya e-mel yang sah hampir tidak pernah tersalah hantar ke folder spam.

Penapis spam menala untuk ketepatan tinggi jadi e-mel yang sah hampir tidak pernah tersalah hantar ke folder spam Pasukan biasanya mendapat hasil yang lebih baik apabila mereka menentukan ambang kualiti di hadapan, mengekalkan laluan peningkatan manusia untuk kes tepi dan menjejaki kedua-dua keuntungan produktiviti dan kos ralat dari semasa ke semasa.

Ketepatan dan Ingat dalam amalan

Ujian saringan perubatan mengutamakan ingatan tinggi untuk mengelakkan kehilangan pesakit yang sebenarnya menghidap penyakit itu, menerima lebih banyak positif palsu untuk susulan.

Ujian saringan perubatan mengutamakan ingatan tinggi untuk mengelakkan kehilangan pesakit yang benar-benar menghidap penyakit itu, menerima lebih banyak positif palsu untuk susulan Pasukan biasanya mendapat hasil yang lebih baik apabila mereka menentukan ambang kualiti di hadapan, mengekalkan laluan peningkatan manusia untuk kes tepi dan menjejaki kedua-dua keuntungan produktiviti dan kos ralat dari semasa ke semasa.

Ketepatan dan Ingat dalam amalan

Sistem carian dan pengesyoran melaporkan precision@k (berapa banyak hasil k teratas yang berkaitan) untuk mengukur kualiti kedudukan.

Sistem carian dan pengesyoran melaporkan precision@k (berapa banyak keputusan k teratas yang berkaitan) untuk mengukur kualiti kedudukan Pasukan biasanya mendapat hasil yang lebih baik apabila mereka mentakrifkan ambang kualiti di hadapan, mengekalkan laluan peningkatan manusia untuk kes kelebihan dan menjejaki kedua-dua keuntungan produktiviti dan kos ralat dari semasa ke semasa.

Ketepatan dan Ingat dalam amalan

Pengesanan penipuan mengimbangi ketepatan dan penarikan balik melalui skor F1, kerana kedua-dua penggera palsu dan penipuan terlepas adalah mahal.

Pengesanan penipuan mengimbangi ketepatan dan penarikan balik melalui skor F1, memandangkan kedua-dua penggera palsu dan penipuan terlepas adalah mahal.

Risiko & Pengawal

!

Pasukan yang berbeza mungkin menggunakan istilah yang sama secara berbeza, jadi tentukan skop lebih awal.

!

Penanda aras boleh kelihatan kukuh manakala prestasi dunia sebenar tidak sekata.

!

Mengabaikan kualiti data dan rancangan penilaian sering menghasilkan hasil yang rapuh.

Hala Tuju Pelaksanaan

1

Mulakan dengan definisi bahasa biasa hasil yang anda perlukan.

Mulakan dengan definisi bahasa biasa hasil yang anda perlukan. Anggap setiap langkah sebagai gerbang bukti: jika kriteria tidak dipenuhi, jeda pelancaran, tutup jurang, dan kemudian kembangkan penggunaan.

2

Pilih satu metrik kejayaan dan satu keadaan kegagalan sebelum ujian.

Pilih satu metrik kejayaan dan satu keadaan kegagalan sebelum ujian. Anggap setiap langkah sebagai gerbang bukti: jika kriteria tidak dipenuhi, jeda pelancaran, tutup jurang, dan kemudian kembangkan penggunaan.

3

Jalankan juruterbang kecil dengan data perwakilan, bukan set demo yang digilap.

Jalankan juruterbang kecil dengan data perwakilan, bukan set demo yang digilap. Anggap setiap langkah sebagai gerbang bukti: jika kriteria tidak dipenuhi, jeda pelancaran, tutup jurang, dan kemudian kembangkan penggunaan.

4

Dokumen di mana Precision dan Recall membantu dan kaedah yang lebih mudah adalah lebih baik.

Dokumen di mana Precision dan Recall membantu dan kaedah yang lebih mudah adalah lebih baik. Anggap setiap langkah sebagai gerbang bukti: jika kriteria tidak dipenuhi, jeda pelancaran, tutup jurang, dan kemudian kembangkan penggunaan.

Teruskan Meneroka