Classification

不平衡數據集的 ROC 曲線

  • January 7, 2015

考慮一個輸入矩陣和一個二進制輸出.

衡量分類器性能的常用方法是使用 ROC 曲線。

在 ROC 圖中,對角線是從隨機分類器獲得的結果。在輸出不平衡的情況下隨機分類器的性能可以提高選擇或者以不同的概率。

這種分類器的性能如何在 ROC 曲線圖中表示?我想它應該是一條不同角度的直線,而不是對角線了?

ROC曲線示例

ROC 曲線對類別平衡不敏感。您現在為隨機分類器獲得的直線已經是使用產生正數的不同概率的結果(0 帶您到 (0, 0) 和 1 帶您到 (1, 1) 之間的任何範圍)。

在不平衡的環境中沒有任何變化。

引用自:https://stats.stackexchange.com/questions/132547

comments powered by Disqus