Regression
邏輯回歸問題的決策函數、預測概率和預測函數有什麼區別?
我一直在瀏覽 sklearn 文檔,但我無法理解這些函數在邏輯回歸上下文中的用途。因為
decision_function
它說它是超平面和測試實例之間的距離。這些特定信息有何用處?這與predict
方法predict-proba
有什麼關係?
回想一下,邏輯回歸的函數形式是
這就是
predict_proba
.指數內的項
是返回的內容
decision_function
。文檔中提到的“超平面”是這個術語是支持向量機的保留,它從字面上估計一個分離的超平面。對於邏輯回歸,這個超平面有點人工構造,它是等概率平面,其中模型已經確定兩個目標類別的可能性相同。
該
predict
函數使用規則返回一個類決策冒著肥皂盒的風險,該
predict
功能幾乎沒有合法用途,我認為在審查其他工作時使用它是錯誤的標誌。我會走得更遠,稱它為 sklearn 本身的設計錯誤(該predict_proba
函數應該被調用predict
,並且predict
應該被調用predict_class
,如果有的話)。