Classification
AUC 是正確分類每個類中隨機選擇的實例的概率嗎?
我在一篇論文中讀到了這個標題,並且從未在其他任何地方看到過以這種方式描述的 AUC。這是真的?有證據或簡單的方法可以看到這一點嗎?
圖 2 顯示了用接收器操作特徵曲線 (AUC) 下面積表示的二分變量的預測準確度,這相當於正確分類兩個隨機選擇的每個類別的用戶(例如,男性和女性)的概率)。
在我看來,這不可能是真的,因為對於 AUC = 0.5,以上表明一個人有 50% 的概率正確預測連續兩次拋硬幣,但實際上,你只有 25% 的機會正確預測連續兩次拋硬幣。至少,這就是我對這句話的看法。
報價略有錯誤。正確的說法是 ROC AUC 是隨機選擇的正例比隨機選擇的負例排名更高的概率。這是由於 ROC AUC 與秩的 Wilcoxon 檢驗之間的關係。
您會發現 Tom Fawcett “ ROC 分析簡介”中的討論很有啟發性。