Boxplot

“何時使用箱線圖和何時使用條形圖”規則(拇指?)

  • February 4, 2014

根據 The R Book (Crawley, 2013),盒須圖和條形圖都是ANOVA 的合適圖形,但哪個更合適?我想這取決於情況……有人可以幫助我嗎?

專門用於 ANOVA 的圖形說明:

  • 對於 ANOVA,箱形圖或條形圖總比沒有圖形好得多,但正如通常繪製的那樣,兩者都是間接的或不完整的圖形摘要。
  • ANOVA 是關於在一種或多種變化的背景下比較均值,因此最合適的圖形將至少顯示均值以及原始數據。組標準偏差 (SD) 或相關數量不會造成任何傷害。
  • 儘管有些箱線圖顯示均值和中位數,但標準類型顯示中位數、四分位數和分佈尾部的一些信息。最常見的變體似乎是當且僅當它們距離較近的四分位數超過 1.5 IQR 時才顯示單個數據點。即:四分位距IQR上四分位數下四分位數,因此繪製為大於上四分位數的點值1.5 IQR 或小於下四分位數1.5 IQR。這樣的約定有助於顯示可能對 ANOVA 有問題的總異常值,但中位數和四分位數在 ANOVA 中都沒有任何作用,中位數是否近似均值是一個需要檢查的點,而不是假設。通常,有經驗的數據分析師將例如明顯的標記異常值和/或分佈不對稱作為需要採取行動的問題的標誌,例如數據轉換或需要具有非同一性鏈接函數的廣義線性模型。然而,令人驚訝的是,有多少教科書和其他賬戶在展示 ANOVA 時顯示箱形圖,但沒有提及不在房間裡的大象,即未繪製的均值。
  • 相反,在這種情況下,最常見的條形圖通過平均值和 SD 或標準誤差來匯總數據,但在其他情況下省略了單個數據點的任何顯示。因此,例如,異常值或顯著的不對稱性只能從個體組內的線外均值或誇大的可變性中推斷出來。

一般來說,對於哪種圖表有用,有很多建議,但關於哪種圖表最好卻沒有達成共識。我建議作為一個好的圖表顯示的標準

  • 數據變化的完整模式,至少作為背景或上下文
  • 數據的相關摘要,特別是那些與正在接受的模型或正在考慮的描述符相關的摘要
  • 數據可能存在問題的跡象,這些問題使人們對所做的假設產生懷疑。

有幾種有助於方差分析的設計,例如帶有附加均值和 SE 的點圖或條圖。

John Tukey 的這篇論文解釋了此處相關的宣傳圖分析圖之間的區別。ANOVA 的太多圖形插圖是宣傳圖(看!這些組非常不同),沒有太多分析(我們還能從數據或該應用程序中的技術限制中了解什麼?)。

引用自:https://stats.stackexchange.com/questions/85372

comments powered by Disqus