K=1 時 KNN 分類器中的訓練誤差

September 14, 2018

我在測驗中得到了這個問題，它詢問當 K=1 時 KNN 分類器的訓練誤差是多少。訓練對 KNN 分類器意味著什麼？我對 KNN 分類器的理解是，它考慮了整個數據集，並為任何新的觀察值分配了大多數最接近的 K 鄰居的值。培訓在哪裡出現？此外，為此提供的正確答案是，無論任何數據集如何，訓練誤差都將為零。這怎麼可能？

此處的訓練錯誤是將訓練集作為測試集輸入到 KNN 時出現的錯誤。當 K = 1 時，您將選擇最接近測試樣本的訓練樣本。由於您的測試樣本在訓練數據集中，它會選擇自己作為最接近的並且永遠不會出錯。因此，無論數據集如何，當 K = 1 時，訓練誤差將為零。順便說一句，這裡有一個合乎邏輯的假設，那就是您的訓練集不會包含屬於不同類別的相同訓練樣本，即相互衝突的信息。不過，一些現實世界的數據集可能具有此屬性。

引用自：https://stats.stackexchange.com/questions/367010

comments powered by Disqus

相關問答

所有機器學習算法是否都分為分類和回歸，而不僅僅是監督學習？

July 19, 2020

Machine-Learning

（為什麼）絕對損失不是正確的計分規則嗎？

June 23, 2020

Machine-Learning

監督學習是強化學習的一個子集嗎？

September 23, 2018

Machine-Learning

KNN 應該使用哪種類型的數據規範化？

August 25, 2018

Machine-Learning

什麼是人工神經網絡？

August 16, 2018

為什麼我們需要擬合 k 最近鄰分類器？

June 5, 2018