Clustering

為什麼 K-means 聚類的決策邊界是線性的?

  • March 26, 2013

顯然,對於 K-means 聚類,數據點是否在聚類中的決策邊界或集群是線性的。

我不太明白這個說法。為什麼是線性的?K-means 聚類的每次迭代,我都會將數據點重新分配給聚類以最小化平方誤差。然後,我重新分配原型(集群的中心)以再次最小化錯誤。

這些過程如何創建“線性決策邊界”?

存在線性和非線性分類問題。在線性問題中,您可以繪製線、平面或超平面(取決於問題中的維數),以便正確分類所有數據點。在非線性問題中,您不能這樣做。如您所知,線、平面或超平面稱為決策邊界。

K-means 聚類產生一個由線性決策邊界組成的Voronoi 圖。例如,本演示文稿描述了集群、決策邊界(幻燈片 34)並簡要描述了 Voronoi 圖,因此您可以看到相似之處。另一方面,依賴於隱藏層數量的神經網絡能夠處理非線性決策邊界問題。最後,支持向量機原則上能夠處理線性問題,因為它們依賴於尋找超平面。但是,使用核技巧,支持向量機可以將非線性問題轉換為線性問題(在更高維空間中)

引用自:https://stats.stackexchange.com/questions/53305

comments powered by Disqus