Temel Bilgiler KILAVUZU

Hassasiyet ve Geri Çağırma

Hassasiyet ve geri çağırma, özellikle sınıflar dengesiz olduğunda, sınıflandırıcıları değerlendirmek için iki tamamlayıcı ölçümdür.

Genel Bakış

Hassasiyet ve geri çağırma, özellikle sınıflar dengesiz olduğunda, sınıflandırıcıları değerlendirmek için iki tamamlayıcı ölçümdür. Birlikte, kesin doğruluğun neleri gizlediğini ortaya çıkarıyorlar; bir modelin pozitif tahminlerinin ne sıklıkla doğru olduğunu ve gerçekte kaç tane gerçek pozitif yakaladığını.

Hassasiyet ve Geri Çağırma, temel yapay zeka araç setinde yer alır. Bunu anladığınızda diğer yapay zeka konularının değerlendirilmesi ve karşılaştırılması daha kolay hale gelir.

Derin Dalış

Bir model öğeleri olumlu olarak işaretlediğinde iki soru önemlidir. Precision şunu sorar: işaretlediğimiz her şeyin ne kadarı gerçekten olumluydu? Bu, gerçek pozitiflerin tahmin edilen tüm pozitiflere bölünmesine eşittir ve yanlış alarmları cezalandırır. Hatırlama (duyarlılık) şunu sorar: Oradaki tüm gerçek pozitiflerden kaçını yakaladık? Bu, gerçek pozitiflerin tüm gerçek pozitiflere bölünmesine eşittir ve kaçırılanları cezalandırır. Bunlar genellikle değiş tokuş edilir: Karar eşiğinin düşürülmesi daha fazla olumlu sonuç yakalar (daha yüksek hatırlama), ancak daha fazla önemsiz işaretler (daha düşük hassasiyet) ve bunun tersi de geçerlidir. Hangisine öncelik verileceği maliyetlere bağlıdır; bir spam filtresi kesinliği tercih eder (gerçek postayı çöpe atmayın), kanser ekranı ise hatırlamayı tercih eder (bir tümörü gözden kaçırmayın). Harmonik ortalamaları olan F1 puanı, her ikisini de tek bir sayı ile dengeler.

Teknik Bilgi

Her iki ölçüm de karışıklık matrisinin gerçek pozitiflerinden (TP), yanlış pozitiflerinden (FP) ve yanlış negatiflerinden (FN) gelir: Kesinlik = TP / (TP + FP), Geri Çağırma = TP / (TP + FN). Özellikle, ikisi de gerçek negatifleri kullanmıyor; bu nedenle, negatiflerin sayısı pozitiflerden çok daha fazla olduğunda bilgilendirici kalıyorlar. Sınıflandırma eşiğinin taranması, bir hassaslık geri çağırma eğrisinin izini sürer; altındaki alan (ortalama hassasiyet) performansı özetler ve yüksek düzeyde dengesiz verilerde ROC-AUC'ye göre tercih edilir.

Hassasiyet ve Geri Çağırma konusunda uzmanlaşmak

Hassasiyet ve geri çağırma, özellikle sınıflar dengesiz olduğunda, sınıflandırıcıları değerlendirmek için iki tamamlayıcı ölçümdür. Birlikte, kesin doğruluğun neleri gizlediğini ortaya çıkarıyorlar; bir modelin pozitif tahminlerinin ne sıklıkla doğru olduğunu ve gerçekte kaç tane gerçek pozitif yakaladığını. Hassasiyet ve Geri Çağırma, temel yapay zeka araç setinde yer alır. Bunu anladığınızda diğer yapay zeka konularının değerlendirilmesi ve karşılaştırılması daha kolay hale gelir. Derin bir anlayış oluşturmak için Hassasiyet ve Geri Çağırma'yı tek bir özellik olarak değil, bir işletim modeli olarak ele alın: istenen sonuçları tanımlayın, varsayımları netleştirin ve sistemin güvenilir bir şekilde yapabileceklerini hâlâ uzman görüşü gerektiren şeylerden ayırın.

Uygulamada, Precision ve Recall'ı kullanan güçlü ekipler önce güçlü kavramsal modeller oluşturur, ardından bu modelleri gerçek üretim kısıtlamalarıyla eşleştirir. Açık başarı kriterlerini belgeliyorlar, gerçekçi verilere ve iş akışlarına göre test ediyorlar ve tek seferlik kıyaslama kazanımları yerine gözlemlenen başarısızlık modellerine dayalı olarak yineleniyorlar. Burası teorik anlayışın ürün, politika ve operasyonlar genelinde dayanıklı yeteneğe dönüştüğü yerdir.

Açık teknik iddiaları pazarlama dilinden ayırmanıza yardımcı olur. Aynı zamanda, Farklı ekipler aynı terimi farklı şekilde kullanabilir; bu nedenle kapsamı erken tanımlayın. En dayanıklı yaklaşım, deneme hızını yönetişim disiplini ile birleştirmektir: pilot uygulamaları çalıştırın, kanıtları toplayın, karar günlüklerini yayınlayın ve model davranışı, kullanıcı beklentileri ve düzenleyici gereksinimler geliştikçe koruma önlemlerini sürekli olarak güncelleyin.

Stratejik Etki

Açık teknik iddiaları pazarlama dilinden ayırmanıza yardımcı olur.

Açık teknik iddiaları pazarlama dilinden ayırmanıza yardımcı olur. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Para veya zaman harcamadan önce daha iyi uygulama soruları sorabilirsiniz.

Para veya zaman harcamadan önce daha iyi uygulama soruları sorabilirsiniz. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Ortak anlayışa sahip ekipler daha iyi ürün, politika ve öğrenme kararları verir.

Ortak anlayışa sahip ekipler daha iyi ürün, politika ve öğrenme kararları verir. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Hassasiyet ve Geri Çağırmanın Geleceği

Yapay zeka, tıbbi teşhis, içerik denetimi, sahtekarlık gibi yüksek riskli alanlara girdikçe, ekipler yalnızca doğruluk yerine giderek daha fazla hassasiyet ve geri çağırma (ve bunların eğrilerini) raporluyor ve eşikleri gerçek dünyadaki maliyetlere ve adalet kısıtlamalarına uyacak şekilde ayarlıyor. Grup başına hassaslık/geri çağırma denetimleri, demografik özellikler genelinde farklı hata oranlarının tespit edilmesinde standart hale geliyor. Paydaşların varsayılan 0,5 eşiğini kabul etmek yerine etkileşimli olarak çalışma noktalarını seçmesine olanak tanıyan daha zengin maliyete duyarlı ölçümler, kalibre edilmiş olasılıklar ve araçlar bekleyebilirsiniz.

Gerçek Dünya Uygulaması

Spam filtreleri yüksek hassasiyete göre ayarlanır, böylece meşru e-postalar neredeyse hiçbir zaman yanlışlıkla spam klasörüne gönderilmez.

Tıbbi tarama testleri, gerçekten hastalığı olan hastaların kaçırılmasını önlemek için yüksek düzeyde hatırlamaya öncelik verir ve takip için daha fazla yanlış pozitifliği kabul eder.

Arama ve öneri sistemleri, sıralama kalitesini ölçmek için Precision@k'yi (en iyi k sonuçtan kaç tanesinin alakalı olduğunu) bildirir.

Sahtekarlık tespiti, hem yanlış alarmlar hem de kaçırılan sahtekarlıklar maliyetli olduğundan, F1 puanı aracılığıyla hassasiyeti ve hatırlamayı dengeler.

Uygulama Modelleri

Uygulamada Hassasiyet ve Geri Çağırma

Spam filtreleri yüksek hassasiyete göre ayarlanır, böylece meşru e-postalar neredeyse hiçbir zaman yanlışlıkla spam klasörüne gönderilmez.

Spam filtreleri yüksek hassasiyete göre ayarlanır, böylece yasal e-postalar neredeyse hiçbir zaman yanlışlıkla spam klasörüne gönderilmez. Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Hassasiyet ve Geri Çağırma

Tıbbi tarama testleri, gerçekten hastalığı olan hastaların kaçırılmasını önlemek için yüksek düzeyde hatırlamaya öncelik verir ve takip için daha fazla yanlış pozitifliği kabul eder.

Tıbbi tarama testleri, gerçekten hastalığı olan hastaların kaçırılmasını önlemek için yüksek geri çağırmaya öncelik verir ve takip için daha fazla hatalı pozitifliği kabul eder. Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Hassasiyet ve Geri Çağırma

Arama ve öneri sistemleri, sıralama kalitesini ölçmek için Precision@k'yi (en iyi k sonuçtan kaç tanesinin alakalı olduğunu) bildirir.

Arama ve öneri sistemleri, sıralama kalitesini ölçmek için sensitive@k'yi (en iyi k sonuçlarından kaç tanesinin alakalı olduğunu) rapor eder Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Hassasiyet ve Geri Çağırma

Sahtekarlık tespiti, hem yanlış alarmlar hem de kaçırılan sahtekarlıklar maliyetli olduğundan, F1 puanı aracılığıyla hassasiyeti ve hatırlamayı dengeler.

Sahtekarlık tespiti, F1 puanı aracılığıyla hassasiyeti ve geri çağırmayı dengeler; çünkü hem yanlış alarmlar hem de kaçırılan dolandırıcılık maliyetlidir. Ekipler genellikle kalite eşiklerini önceden tanımladıklarında, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Riskler ve Korkuluklar

!

Farklı ekipler aynı terimi farklı şekilde kullanabilir; bu nedenle kapsamı erken tanımlayın.

!

Gerçek dünya performansı dengesizken karşılaştırmalar güçlü görünebilir.

!

Veri kalitesini ve değerlendirme planlarını göz ardı etmek çoğu zaman hassas sonuçlar doğurur.

Uygulama Yol Haritası

1

İhtiyacınız olan sonucun sade bir dille tanımlanmasıyla başlayın.

İhtiyacınız olan sonucun sade bir dille tanımlanmasıyla başlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

2

Test etmeden önce bir başarı ölçüsü ve bir başarısızlık koşulu seçin.

Test etmeden önce bir başarı ölçüsü ve bir başarısızlık koşulu seçin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

3

Gösterişli bir demo seti yerine, temsili verilerle küçük bir pilot çalışma yürütün.

Gösterişli bir demo seti yerine, temsili verilerle küçük bir pilot çalışma yürütün. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

4

Hassasiyet ve Geri Çağırma'nın nerede yardımcı olduğunu ve daha basit yöntemlerin nerede daha iyi olduğunu belgeleyin.

Hassasiyet ve Geri Çağırma'nın nerede yardımcı olduğunu ve daha basit yöntemlerin nerede daha iyi olduğunu belgeleyin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

Keşfetmeye Devam Edin