Interpretation
如何解釋層次聚類分析的樹狀圖
考慮下面的 R 示例:
plot( hclust(dist(USArrests), "ave") )
- y軸“高度”到底是什麼意思?
- 看看北卡羅來納州和加利福尼亞州(位於左側)。加利福尼亞比亞利桑那“更接近”北卡羅來納州嗎?我可以做出這樣的解釋嗎?
- 夏威夷(右)很晚才加入該集群。我可以看到這一點,因為它比其他州“更高”。一般來說,我如何正確解釋樹狀圖中標籤“更高”或“更低”的事實?
y 軸衡量單個數據點或集群的接近程度。
加利福尼亞州和亞利桑那州與佛羅里達州的距離相等,因為 CA 和 AZ 在任何一個加入 FL 之前都在一個集群中。
夏威夷加入的時間很晚;大約為 50。這意味著它加入的集群在 HI 加入之前更靠近。但也不是很近。請注意,它加入的集群(一直在右側)僅在大約 45 處形成。HI 加入集群的時間比任何其他狀態都晚,這一事實僅僅意味著(使用您選擇的任何指標)HI 不是那麼接近任何特定的狀態。