關於邏輯回歸的哲學問題：為什麼沒有訓練出最優閾值？

April 25, 2019

通常在邏輯回歸中，我們擬合一個模型並在訓練集上得到一些預測。然後，我們對這些訓練預測（類似於此處）進行交叉驗證，並根據 ROC 曲線之類的內容確定最佳閾值。

為什麼我們不將閾值的交叉驗證合併到實際模型中，並端到端地訓練整個事情呢？

沒有使用模型訓練閾值，因為邏輯回歸不是分類器（參見，為什麼不將邏輯回歸稱為邏輯分類？）。它是一個估計參數的模型， $ p $ ，它控制伯努利分佈的行為。也就是說，您假設以協變量為條件的響應分佈是伯努利，因此您想要估計控制該變量的參數如何隨協變量而變化。它只是一個直接概率模型。當然，後續也可以用作分類器，有時在某些情況下是這樣，但它仍然是一個概率模型。

引用自：https://stats.stackexchange.com/questions/405041

comments powered by Disqus

相關問答

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

Machine-Learning

為什麼 ROC 對類分佈不敏感？

September 20, 2021

Machine-Learning

RMSE 與 MSE 損失函數 - 優化解決方案是等價的嗎？

June 27, 2021

Machine-Learning

為什麼我和我的同事對測試集和驗證集的定義相反？

May 24, 2021

線性回歸和最小二乘回歸一定是一回事嗎？

May 11, 2021

為什麼我們在進行 MLE 時將對數似然乘以 -2？

April 10, 2021