K-Nearest-Neighbour

kNN 和不平衡類

  • July 20, 2010

你認為不平衡的類是 k-最近鄰的一個大問題嗎?如果是這樣,你知道有什麼聰明的方法來處理這個嗎?

原則上,不平衡的類對於 k-最近鄰算法來說根本不是問題。

因為該算法不受類大小的任何影響,所以它不會基於大小而偏愛任何類。嘗試使用明顯的異常值和 k+1 運行 k-means,您會發現大多數情況下異常值會得到自己的類別。

當然,對於硬數據集,始終建議多次運行該算法。這是為了避免由於初始化錯誤而引起的麻煩。

引用自:https://stats.stackexchange.com/questions/341

comments powered by Disqus