Model

過度擬合的模型一定沒用嗎?

  • May 11, 2017

假設一個模型在訓練數據上的準確率是 100%,而在測試數據上的準確率是 70%。以下關於該模型的論點是否正確?

很明顯,這是一個過擬合的模型。通過減少過擬合可以提高測試精度。但是,這個模型仍然是一個有用的模型,因為它對測試數據具有可接受的準確性。

我認為這個論點是正確的。如果 70% 在特定應用中是可以接受的,那麼即使模型過擬合(更一般地說,不管它是否過擬合),它也是有用的。

在平衡過擬合和欠擬合關注最優性(尋找最佳解決方案)時,具有令人滿意的性能是關於充分性(模型對任務的性能是否足夠好?)。一個模型可以足夠好而不是最優的。

**編輯:**在 OP 下的 Firebug 和 Matthew Drury 的評論之後,我將補充一點,以判斷模型是否過度擬合而不知道驗證性能可能有問題。Firebug 建議比較驗證與測試性能來衡量過度擬合的數量。然而,當模型在訓練集上提供 100% 的準確度而在測試集上提供 100% 的準確度時,它是可能過度擬合的指標(尤其是在回歸的情況下,但不一定在分類中)。

引用自:https://stats.stackexchange.com/questions/278882

comments powered by Disqus