Clustering

為什麼我們使用 k-means 而不是其他算法?

  • May 13, 2013

我研究了 k-means,我得到了這些:k-means 是最簡單的算法之一,它使用無監督學習方法來解決已知的聚類問題。它適用於大型數據集。

但是,K-Means 也有以下缺點:

  • 對異常值和噪聲非常敏感
  • 不適用於非圓形簇形狀——簇的數量和初始種子值需要事先指定
  • 通過局部最優的能力低。

k-means 有什麼好的嗎,因為似乎弊端超出了 k-means 的優點。

請教我。

其他具有更好特徵的聚類算法往往更昂貴。在這種情況下,k-means 成為預聚類的一個很好的解決方案,將空間減少為可以應用其他聚類算法的不相交的較小子空間。

引用自:https://stats.stackexchange.com/questions/58855

comments powered by Disqus