Model-Selection

了解驗證和模型選擇的引導

August 19, 2011

我想我了解引導的基本原理是如何工作的，但我不確定我是否理解如何使用引導進行模型選擇或避免過度擬合。

例如，對於模型選擇，您是否會選擇在其引導樣本中產生最低誤差（可能是方差？）的模型？

是否有任何文本討論如何使用自舉進行模型選擇或驗證？

**編輯：**請參閱此線程和@mark999 的答案以了解此問題背後的更多上下文。

首先你必須決定你是否真的需要模型選擇，或者你只需要建模。在大多數情況下，根據維度，擬合靈活的綜合模型是首選。

bootstrap 是評估模型性能的好方法。最簡單的估計是方差。更重要的是，引導程序可以估計給定建模過程在尚未實現的新數據上可能的未來性能。

如果使用重採樣（引導或交叉驗證）來選擇模型調整參數和估計模型，則需要雙引導或嵌套交叉驗證。

一般來說，bootstrap 需要的模型擬合（通常約為 300 次）比交叉驗證（10 倍交叉驗證應重複 50-100 次以保持穩定性）更少。

一些模擬研究可以在http://biostat.mc.vanderbilt.edu/rms找到

引用自：https://stats.stackexchange.com/questions/14516

comments powered by Disqus

相關問答

Hypothesis-Testing

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

November 9, 2021

Machine-Learning

為什麼我和我的同事對測試集和驗證集的定義相反？

May 24, 2021

隨機森林是否擅長檢測交互項？

January 10, 2021

為什麼不以以下方式進行引導？

October 30, 2020

自舉回歸分析後，所有 p 值都是 0.001996 的倍數

September 20, 2020

應該如何比較兩個交叉驗證的邏輯回歸模型？

September 9, 2020