Data-Visualization
將兩個直方圖放在同一比例上的最佳方法?
假設我有兩個我想詳細比較的分佈,即以一種使形狀、比例和移位容易可見的方式。做到這一點的一個好方法是為每個分佈繪製一個直方圖,將它們放在相同的 X 尺度上,然後將一個堆疊在另一個下方。
這樣做時,應該如何進行分箱?即使一個分佈比另一個分佈更分散,兩個直方圖是否應該使用相同的 bin 邊界,如下圖 1 所示?是否應該在縮放之前為每個直方圖獨立完成分箱,如下圖 2 所示?在這方面甚至有一個好的經驗法則嗎?
我認為您需要使用相同的垃圾箱。否則,頭腦會欺騙你。Normal(0,2) 在 Image #2 中相對於 Normal(0,1) 看起來比在 Image #1 中更分散。與統計無關。看起來 Normal(0,1) 進行了“節食”。
——拉爾夫·溫特斯
中點和直方圖端點也可以改變對分散的感知。請注意,在此小程序中,最大 bin 選擇意味著 >1.5 - ~5 的範圍,而最小 bin 選擇意味著 <1 - > 5.5 的範圍