Machine-Learning
樣本權重如何在分類模型中發揮作用?
在分類算法中為每個樣本提供權重意味著什麼?分類算法(例如邏輯回歸、SVM)如何使用權重來更加強調某些示例?我很想詳細了解這些算法如何利用權重。
如果您查看邏輯回歸的 sklearn文檔,您可以看到 fit 函數具有一個可選
sample_weight
參數,該參數定義為分配給單個樣本的權重數組。
正如 Frans Rodenburg 在他的評論中已經正確指出的那樣,在大多數情況下,實例或樣本權重會影響由相關方法優化的損失函數。
考慮文檔為 C-SVM 的原始問題提供的方程
這裡對於每個訓練樣本都是相同的,為每個實例分配相等的“成本”。在有樣本權重傳遞給擬合函數的情況下
“樣本加權重新調整了 C 參數,這意味著分類器更加強調正確處理這些點。”
正如這個例子所說,它還提供了一個很好的可視化效果,顯示了由更大的圓圈(具有更大權重的圓圈)表示的實例如何影響決策邊界。