Data-Visualization
可視化繪製多維集群數據
我有一個包含 16 個變量的數據集,通過 kmeans 聚類後,我希望繪製這兩個組。
你建議用什麼圖來直觀地表示這兩個集群?
沒有單一的正確可視化。這取決於您想要查看或強調集群的哪個方面。
想看看每個變量的貢獻嗎?考慮一個平行坐標圖。
你想看看集群是如何沿著主成分分佈的嗎?考慮一個雙標圖(2D 或 3D):
您是否要在所有維度上查找集群異常值。考慮到集群 1 中心的距離與到集群中心 2 的距離的散點圖。(根據 K 的定義,每個集群將落在對角線的一側。)
您想查看與聚類相比的成對關係嗎?考慮一個按簇著色的散點圖矩陣。
您想查看集群距離的摘要視圖嗎?考慮任何分佈可視化的比較,例如直方圖、小提琴圖或箱線圖。