Classification

我如何使我的二元分類器偏愛假陽性錯誤而不是假陰性?

  • January 24, 2021

我已經使用 Keras 的 Sequential 模型組合了一個二元分類器。在其錯誤中,它以假陰性比假陽性更頻繁地進行預測。

該工具適用於醫療應用,我寧願誤報,以免在謹慎方面犯錯。

我如何嘗試調整模型以更喜歡一類而不是另一類?

解決此問題的標準方法如下:

  1. 正如 Dave 的回答中提到的,不要採用 Keras 分類器的二進制預測,而是使用分數或 logits - 即您需要對正類有一個置信度值,而不是對正類進行硬預測“1”類和負類為“0”。(大多數 Keras 模型都有一種model.predict()方法可以讓您對每個類都有信心)。
  2. 現在繪製一條 ROC 曲線,sklearn 有一些現成的漂亮功能:https ://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html 。這條曲線基本上繪製了真陽性率與假陽性率,這是通過在預測置信度上設置各種閾值併計算真陽性率(TPR)和假陽性率(FPR)而獲得的。
  3. 查看 ROC 曲線,您可以選擇您喜歡的點(即假陰性極少且假陽性數可接受)。給出這個(TPR,FPR)點的閾值應該是您的分類器的操作點(即將此閾值應用於“類 1”的模型置信度)。

引用自:https://stats.stackexchange.com/questions/506272

comments powered by Disqus