Machine-Learning

樣本權重如何在分類模型中發揮作用？

August 20, 2018

在分類算法中為每個樣本提供權重意味著什麼？分類算法（例如邏輯回歸、SVM）如何使用權重來更加強調某些示例？我很想詳細了解這些算法如何利用權重。

如果您查看邏輯回歸的 sklearn文檔，您可以看到 fit 函數具有一個可選sample_weight參數，該參數定義為分配給單個樣本的權重數組。

正如 Frans Rodenburg 在他的評論中已經正確指出的那樣，在大多數情況下，實例或樣本權重會影響由相關方法優化的損失函數。

考慮文檔為 C-SVM 的原始問題提供的方程

這裡對於每個訓練樣本都是相同的，為每個實例分配相等的“成本”。在有樣本權重傳遞給擬合函數的情況下

“樣本加權重新調整了 C 參數，這意味著分類器更加強調正確處理這些點。”

正如這個例子所說，它還提供了一個很好的可視化效果，顯示了由更大的圓圈（具有更大權重的圓圈）表示的實例如何影響決策邊界。

引用自：https://stats.stackexchange.com/questions/362987

comments powered by Disqus

相關問答

Machine-Learning

哪個是第一位的 - 領域專業知識或實驗方法？

December 30, 2021

可以使用多項式邏輯回歸學習任何數據嗎

October 26, 2021

sklearn邏輯回歸收斂到一個簡單案例的意外係數

July 1, 2021

為什麼我們使用術語“人口”而不是“數據生成過程”？

May 8, 2021

現實世界問題中的隨機抽樣和獨立性

March 29, 2021

我如何使我的二元分類器偏愛假陽性錯誤而不是假陰性？

January 24, 2021