Loading [MathJax]/jax/output/HTML-CSS/fonts/TeX/fontdata.js

k=1 的 k-NN 是否總是意味著過度擬合？

July 14, 2014

我在某處發現了這樣的聲明，但另一方面，在我發現的一些來源中，這沒關係。

在解釋變量是 TF-IDF 值（餘弦測量）的二元分類問題中使用 1-NN 時過擬合的風險如何？

您的標題問題的簡短回答是“否”。考慮一個具有二進制目標變量的示例，該變量在很大程度上被單個解釋變量的某個值完全分開：

顯然，1-NN 分類在這裡可以很好地工作並且不會過擬合。（事實上還有其他方法可以同樣有效並且可能更簡單，這與中心點無關。）

TF-IDF 值超出了我的專業領域，但總的來說，寫得鬆散，目標值的值在解釋值跨越的空間中的間隔越大，1-NN 分類就越有效，而不管應用領域。

引用自：https://stats.stackexchange.com/questions/107870

相關問答

對訓練集進行插值實際上意味著什麼？

June 24, 2021

Machine-Learning

過擬合比欠擬合“更好”嗎？

April 28, 2021

Machine-Learning

為什麼轉換器使用層範數而不是批量範數？

June 28, 2020

Machine-Learning

LSTM（長短期記憶）死了嗎？

June 18, 2020

為什麼邏輯回歸在高維度上特別容易過擬合？

June 1, 2020

當報告的相關性不接近 +1/-1 時如何簡化奇異隨機結構

February 12, 2020