Clustering
為什麼我們使用 k-means 而不是其他算法?
我研究了 k-means,我得到了這些:k-means 是最簡單的算法之一,它使用無監督學習方法來解決已知的聚類問題。它適用於大型數據集。
但是,K-Means 也有以下缺點:
- 對異常值和噪聲非常敏感
- 不適用於非圓形簇形狀——簇的數量和初始種子值需要事先指定
- 通過局部最優的能力低。
k-means 有什麼好的嗎,因為似乎弊端超出了 k-means 的優點。
請教我。
其他具有更好特徵的聚類算法往往更昂貴。在這種情況下,k-means 成為預聚類的一個很好的解決方案,將空間減少為可以應用其他聚類算法的不相交的較小子空間。