Roc
ROC 曲線下的精度與面積
我為診斷系統構建了 ROC 曲線。然後非參數估計曲線下面積為 AUC = 0.89。當我嘗試在最佳閾值設置(最接近點 (0, 1) 的點)下計算準確度時,我得到診斷系統的準確度為 0.8,小於 AUC!當我檢查另一個遠離最佳閾值的閾值設置的精度時,我得到的精度等於 0.92。是否有可能使診斷系統在最佳閾值設置下的準確度低於另一個閾值的準確度,也低於曲線下面積?請看附圖。
這確實是可能的。關鍵是要記住準確率受類不平衡的影響很大。例如,在您的情況下,負樣本比正樣本多,因為當 FPR () 接近於 0,而 TPR (=) 為 0.5,您的準確度 () 仍然很高。
換句話說,由於你有更多的負樣本,如果分類器一直預測為 0,它仍然會在 FPR 和 TPR 接近 0 的情況下獲得很高的準確率。
您所說的最佳閾值設置(最接近點 (0, 1) 的點)只是最佳閾值的眾多定義之一:它不一定會優化準確性。