Logistic
關於邏輯回歸的哲學問題:為什麼沒有訓練出最優閾值?
通常在邏輯回歸中,我們擬合一個模型並在訓練集上得到一些預測。然後,我們對這些訓練預測(類似於此處)進行交叉驗證,並根據 ROC 曲線之類的內容確定最佳閾值。
為什麼我們不將閾值的交叉驗證合併到實際模型中,並端到端地訓練整個事情呢?
沒有使用模型訓練閾值,因為邏輯回歸不是分類器(參見,為什麼不將邏輯回歸稱為邏輯分類?)。它是一個估計參數的模型, $ p $ ,它控制伯努利分佈的行為。也就是說,您假設以協變量為條件的響應分佈是伯努利,因此您想要估計控制該變量的參數如何隨協變量而變化。它只是一個直接概率模型。當然,後續也可以用作分類器,有時在某些情況下是這樣,但它仍然是一個概率模型。