Interpretation

如何解釋層次聚類分析的樹狀圖

  • January 15, 2014

考慮下面的 R 示例:

plot( hclust(dist(USArrests), "ave") )

  1. y軸“高度”到底是什麼意思?
  2. 看看北卡羅來納州和加利福尼亞州(位於左側)。加利福尼亞比亞利桑那“更接近”北卡羅來納州嗎?我可以做出這樣的解釋嗎?
  3. 夏威夷(右)很晚才加入該集群。我可以看到這一點,因為它比其他州“更高”。一般來說,我如何正確解釋樹狀圖中標籤“更高”或“更低”的事實?

在此處輸入圖像描述

  1. y 軸衡量單個數據點或集群的接近程度。

  2. 加利福尼亞州和亞利桑那州與佛羅里達州的距離相等,因為 CA 和 AZ 在任何一個加入 FL 之前都在一個集群中。

  3. 夏威夷加入的時間很晚;大約為 50。這意味著它加入的集群在 HI 加入之前更靠近。但也不是很近。請注意,它加入的集群(一直在右側)僅在大約 45 處形成。HI 加入集群的時間比任何其他狀態都晚,這一事實僅僅意味著(使用您選擇的任何指標)HI 不是那麼接近任何特定的狀態。

引用自:https://stats.stackexchange.com/questions/82326

comments powered by Disqus