Regression

邏輯回歸問題的決策函數、預測概率和預測函數有什麼區別?

  • February 21, 2018

我一直在瀏覽 sklearn 文檔,但我無法理解這些函數在邏輯回歸上下文中的用途。因為decision_function它說它是超平面和測試實例之間的距離。這些特定信息有何用處?這與predict方法predict-proba有什麼關係?

回想一下,邏輯回歸的函數形式是

這就是predict_proba.

指數內的項

是返回的內容decision_function。文檔中提到的“超平面”是

這個術語是支持向量機的保留,它從字面上估計一個分離的超平面。對於邏輯回歸,這個超平面有點人工構造,它是等概率平面,其中模型已經確定兩個目標類別的可能性相同。

predict函數使用規則返回一個類決策

冒著肥皂盒的風險,該predict功能幾乎沒有合法用途,我認為在審查其他工作時使用它是錯誤的標誌。我會走得更遠,稱它為 sklearn 本身的設計錯誤(該predict_proba函數應該被調用predict,並且predict應該被調用predict_class,如果有的話)。

引用自:https://stats.stackexchange.com/questions/329857

comments powered by Disqus