K-Nearest-Neighbour
kNN 和不平衡類
你認為不平衡的類是 k-最近鄰的一個大問題嗎?如果是這樣,你知道有什麼聰明的方法來處理這個嗎?
原則上,不平衡的類對於 k-最近鄰算法來說根本不是問題。
因為該算法不受類大小的任何影響,所以它不會基於大小而偏愛任何類。嘗試使用明顯的異常值和 k+1 運行 k-means,您會發現大多數情況下異常值會得到自己的類別。
當然,對於硬數據集,始終建議多次運行該算法。這是為了避免由於初始化錯誤而引起的麻煩。