Machine-Learning

了解交叉驗證的遞歸特徵消除

September 27, 2017

我想了解遞歸特徵消除（RFE）與交叉驗證（CV）相結合的算法。Guyon 等人的原始資料。關於 RFE 可以在這裡找到。

我對 RFE 的理解：我們首先訓練我們的分類器——比如一個線性支持向量機——所有的特徵。這給了我們每個特徵的權重。這些權重的絕對值反映了每個特徵的重要性。我們刪除最不重要的特徵，再次進行訓練，獲得新的排名並繼續，直到我們對所有特徵進行排名

我的問題：我正在運行 RFE 交叉驗證（在具有此實現的 python 中）。在下面的示例中，有幾個特徵排名第一。這是怎麼回事？對於最終排名，我假設 RFE 消除必須重複進行，那麼這是否意味著 RFE 的多次應用，每次另一個功能都排名第一？這如何與交叉驗證相結合，當每個子集可能包含不同的特徵時，如何計算（見下圖）來自 1,2,3,..features 的分類精度？

假設您運行 3 倍 RFECV。對於每次拆分，訓練集將被 RFE 轉換 n 次（對於每個可能的 1..n 個特徵）。提供的分類器將在訓練集上進行訓練，並在測試集上計算分數。最終，對於每 1..n 個特徵，3 個不同拆分的平均結果會顯示在您包含的圖表上。然後，RFEVC 使用得分最高的特徵數對整個集合進行轉換。您看到的排名是基於最終的轉換。

引用自：https://stats.stackexchange.com/questions/305191

相關問答

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

如果使用所有 PC，PCA 是否提供優勢？

July 22, 2021

Machine-Learning

RMSE 與 MSE 損失函數 - 優化解決方案是等價的嗎？

June 27, 2021

線性回歸和最小二乘回歸一定是一回事嗎？

May 11, 2021

為什麼我們在進行 MLE 時將對數似然乘以 -2？

April 10, 2021

使用牛頓法優化 OLS

March 16, 2021