Cross-Validation

使用 k 折交叉驗證時,我們是否需要測試集?

  • July 27, 2016

我一直在閱讀有關 k-fold 驗證的內容,我想確保我了解它是如何工作的。

我知道對於holdout方法,數據被分成三組,測試集僅用於最後評估模型的性能,而驗證集用於調整超參數等。

**在k-fold方法中,我們最後是否還保留一個測試集,**只使用剩餘數據進行訓練和超參數調優,即我們將剩餘數據分成k折,然後使用訓練後的平均準確率每次折疊(或我們選擇調整超參數的任何性能指標)?還是我們根本不使用單獨的測試集,而只是將整個數據集分成 k 折(如果是這種情況,我假設我們只是將 k 折上的平均準確率視為我們的最終準確率)?

在K-Fold方法中,我們最後是否還保留一個測試集,只使用剩餘的數據進行訓練和超參數調優(即我們將剩餘的數據分成k折,然後使用之後的平均準確率)每次折疊(或我們選擇的任何性能指標)進行訓練以調整我們的超參數)?

是的。作為一項規則,測試集永遠不應該用來改變你的模型(例如,它的超參數)。

然而,交叉驗證有時可以用於超參數調整以外的目的,例如確定訓練/測試拆分對結果的影響程度。

引用自:https://stats.stackexchange.com/questions/225949

comments powered by Disqus