Classification

在隨機森林中使用 LASSO

  • March 12, 2013

我想使用以下過程創建一個隨機森林:

  • 使用信息增益在數據和特徵的隨機樣本上構建樹以確定拆分
  • 如果葉節點超過預定義的深度,則終止葉節點,或者任何拆分都會導致葉數小於預定義的最小值
  • 不是為每棵樹分配一個類標籤,而是分配葉節點中類的比例
  • 在構建了預定義的數量後停止構建樹

這以兩種方式顛覆了傳統的隨機森林過程。一,它使用分配比例而不是類標籤的修剪樹。第二,停止標準是預定數量的樹,而不是一些袋外錯誤估計。

我的問題是這樣的:

對於上述輸出 N 棵樹的過程,我可以使用帶 LASSO 選擇的*邏輯回歸擬合模型嗎?*有沒有人有使用邏輯 LASSO 擬合隨機森林分類器和後處理的經驗?

ISLE 框架提到使用 LASSO 作為回歸問題的後處理步驟,而不是分類問題。此外,在谷歌搜索“隨機森林套索”時,我沒有得到任何有用的結果。

這聽起來有點像梯度樹提升。boosting的思想是找到一類模型的最佳線性組合。如果我們將一棵樹擬合到數據中,我們試圖找到最能解釋結果變量的樹。如果我們改為使用提升,我們試圖找到樹的最佳線性組合。

然而,使用 boosting 我們效率更高一些,因為我們沒有隨機樹的集合,但是我們嘗試構建新的樹來處理我們還不能很好預測的示例。

有關這方面的更多信息,我建議閱讀統計學習要素的第 10 章:http: //statweb.stanford.edu/~tibs/ElemStatLearn/

雖然這不是您問題的完整答案,但我希望它有所幫助。

引用自:https://stats.stackexchange.com/questions/52034

comments powered by Disqus