Classification

結合敏感性和特異性的分類器性能度量?

  • August 10, 2013

我有 2 類標記的數據,我正在使用多個分類器對其進行分類。並且數據集很平衡。在評估分類器的性能時,我需要考慮分類器在確定真陽性和真陰性方面的準確性。因此,如果我使用準確率,並且如果分類器偏向於正面並將所有內容分類為正面,我將獲得大約 50% 的準確率,即使它無法對任何真正的負面進行分類。這個屬性擴展到精確度和召回率,因為它們只關註一個類,然後是 F1 分數。(這就是我從這篇論文中所理解的,例如“ Beyond Accuracy, F-score and ROC: a Family of Discriminant measure for Performance Evaluation ”)。

因此,我可以使用敏感性和特異性(TPR 和 TNR)來查看分類器對每個類的執行情況,我的目標是最大化這些值。

我的問題是,我正在尋找一種將這兩個值組合成一個有意義的度量的度量。我研究了那篇論文中提供的措施,但我發現它並非微不足道。根據我的理解,我想知道為什麼我們不能應用像 F 分數這樣的東西,而是使用靈敏度和特異性而不是使用精度和召回率?所以公式是

我的目標是最大化這一措施。我覺得很有代表性。已經有類似的公式了嗎?這是否有意義,或者在數學上是否合理?

我想說,您可能不應該考慮任何特定的或只有一種措施。

上次我做概率分類時,我有一個 R 包 ROCR 和 False Positives 和 False Negatives 的顯式成本值。

我考慮了從 0 到 1 的所有截止點,並在選擇此截止點時使用了許多措施,例如預期成本。當然,我已經對分類準確性的一般測量進行了 AUC 測量。但對我來說,這不是唯一的可能性。

FP 和 FN 案例的值必須超出您的特定模型,也許這些是由某些主題專家提供的?

例如,在客戶流失分析中,錯誤地推斷出客戶沒有流失可能會更昂貴,而且如果沒有準確地將這些服務定位到正確的群體,那麼對服務價格進行普遍降低將是昂貴的。

-分析師

引用自:https://stats.stackexchange.com/questions/67027

comments powered by Disqus