Data-Visualization

繪製小樣本

  • February 17, 2016

我有一個包含 14 個不同時間的小數據集來完成一項任務。但是,我很難找到合適的圖表來繪製數據。如果樣本較大,我將使用箱線圖或直方圖,但我不確定在樣本如此小的情況下是否適合使用。

更新:時間是 5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2

我認為這裡的基本原則是你可以而且應該展示所有的個人價值觀。即使細節不明顯有趣或有用,也沒有理由不展示它,或者強迫讀者解碼(比如說)一個直方圖,其中條形可能只代表一個或兩個值。

我在這裡提供一個小型複合材料。左上角是一個點或帶狀圖(至少有二十個其他名稱被用於相同的想法),水平呈現,右上是垂直呈現的相同想法。相同值的實例通過堆疊匹配。

底部是 Parzen 意義上的分位數箱圖,其中默認的水平尺度是累積概率(用常用術語繪製位置),並且可以繪製傳統的中位數和四分位數箱,使得(原則上)一半值在盒子裡面,就像一直宣傳的那樣,一半的值在外面。這裡額外的水平線代表平均值。有些人在箱線圖中添加手段作為額外的點或標記符號;我發現這可能與顯示數據本身發生衝突,我更喜歡多一行。如果中值線和均值線似乎重合,您需要考慮該怎麼做。幾乎總是平均值和中位數明顯不同。

可以說,在圖表上明確測量單位是標準的,但我看不出它們是什麼。

在此處輸入圖像描述

(我在這里特意提出了一個額外的觀點,即圖表可以非常小但仍然可以提供信息。在實踐中,我不會讓它們變得這麼小。)

編輯:

在 Parzen 的意義上,廣泛添加到分位數箱形圖的交叉引用(下面第二個中的進一步參考;存在“分位數箱形圖”的其他用途)

如何測量具有多個零的非參數數據之間的差異?

如何使用箱線圖找到值更可能來自不同條件的點?

如何可視化獨立的兩個樣本 t 檢驗?

如何使用 Mann-Whitney U 檢驗得到哪個實驗做得更好?

Shera, DM 1991。分位數圖的一些用途,以增強數據表示。 計算科學與統計23:50-53。

Militký, J. 和 M. Meloun。1993. 用於單變量探索性數據分析的一些圖形輔助工具。 分析化學學報277:215-221。

Meloun, M. 和 J. Militký。1994. 分析化學計量學中的計算機輔助數據處理。一、單變量數據的探索性分析。 化學論文48:151-157。

編輯2:

這些線程的主要目的不僅僅是回答直接的問題,而是觸及其他人可能感興趣的非常相似的問題。

此處其他答案中的其他一些圖形設計顯示了標識符,在沒有其他細節的情況下,不可知地標記為 1 … 14。假設這些和其他標識符在解釋中使用,顯示它們的簡單設計是(克利夫蘭)點圖。以下是幾種可能性中的兩種,其中標識符順序按字面意思(左)和值排序(右)。如果需要,有足夠的空間放置更長的標籤。

與條形圖相比,這種設計的一個優勢是響應或結果軸可能從一個不為零的值開始,如果這似乎是一個更好的選擇的話。

旋轉圖表以使響應軸垂直也很容易想像。

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/197070

comments powered by Disqus