為什麼 K-means 聚類的決策邊界是線性的？

March 26, 2013

顯然，對於 K-means 聚類，數據點是否在聚類中的決策邊界或集群是線性的。

我不太明白這個說法。為什麼是線性的？K-means 聚類的每次迭代，我都會將數據點重新分配給聚類以最小化平方誤差。然後，我重新分配原型（集群的中心）以再次最小化錯誤。

這些過程如何創建“線性決策邊界”？

存在線性和非線性分類問題。在線性問題中，您可以繪製線、平面或超平面（取決於問題中的維數），以便正確分類所有數據點。在非線性問題中，您不能這樣做。如您所知，線、平面或超平面稱為決策邊界。

K-means 聚類產生一個由線性決策邊界組成的Voronoi 圖。例如，本演示文稿描述了集群、決策邊界（幻燈片 34）並簡要描述了 Voronoi 圖，因此您可以看到相似之處。另一方面，依賴於隱藏層數量的神經網絡能夠處理非線性決策邊界問題。最後，支持向量機原則上能夠處理線性問題，因為它們依賴於尋找超平面。但是，使用核技巧，支持向量機可以將非線性問題轉換為線性問題（在更高維空間中）

引用自：https://stats.stackexchange.com/questions/53305

comments powered by Disqus

相關問答

初始化 K-means 聚類的方法

December 6, 2017

餘弦距離作為 KMeans 中的相似性度量

August 21, 2017

聚類作為降維

July 4, 2017

K-means：實際情況下迭代多少次？

February 14, 2017

了解冰淇淋銷售與溫度的 PCA 圖

September 21, 2016

我怎麼知道我的 k-means 聚類算法正遭受維數災難？

August 30, 2016