Data-Visualization

可視化繪製多維集群數據

  • March 18, 2013

我有一個包含 16 個變量的數據集,通過 kmeans 聚類後,我希望繪製這兩個組。

你建議用什麼圖來直觀地表示這兩個集群?

沒有單一的正確可視化。這取決於您想要查看或強調集群的哪個方面。

想看看每個變量的貢獻嗎?考慮一個平行坐標圖。

兩個集群的平行坐標和集群均值

你想看看集群是如何沿著主成分分佈的嗎?考慮一個雙標圖(2D 或 3D):

聚類雙標圖

您是否要在所有維度上查找集群異常值。考慮到集群 1 中心的距離與到集群中心 2 的距離的散點圖。(根據 K 的定義,每個集群將落在對角線的一側。)

在此處輸入圖像描述

您想查看與聚類相比的成對關係嗎?考慮一個按簇著色的散點圖矩陣。

在此處輸入圖像描述

您想查看集群距離的摘要視圖嗎?考慮任何分佈可視化的比較,例如直方圖、小提琴圖或箱線圖。

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/52625

comments powered by Disqus