Data-Visualization

跟進:在混合方差分析圖中,估計 SE 還是實際 SE?

  • August 24, 2010

我目前正在完成一篇論文,昨天偶然發現了這個問題,這導致我向自己提出了同樣的問題。向我的圖表提供來自數據的實際標準誤差還是根據我的 ANOVA 估計的標準誤差更好?

由於昨天的問題相當不具體,而我的問題非常具體,我認為提出這個後續問題是合適的。

詳細信息:

我在一些認知心理學領域(條件推理)進行了一項實驗,比較了兩組(歸納和演繹指令,即受試者間操作)和兩個受試者內操作(問題類型和問題內容,每個都有兩個因子水平)。

結果如下所示(左圖為來自 ANOVA 輸出的 SE 估計,右圖為根據數據估計的 SE): 替代文字

請注意,不同的線代表兩個不同的組(即,受試者之間的操作)和組內受試者操作繪製在 x 軸上(即 2x2 因子水平)。

在正文中,我提供了 ANOVA 的各自結果,甚至還計劃了對中間關鍵交叉交互的比較。**SE 是為了給讀者一些關於數據可變性的提示。**我更喜歡 SE,而不是標準差和置信區間,因為繪製 SD 並不常見,並且在比較受試者內和受試者之間的 CI 時存在嚴重問題(因為同樣適用於 SE,錯誤推斷顯著差異並不常見從他們)。

重複我的問題:繪製從 ANOVA 估計的 SE 更好還是應該繪製從原始數據估計的 SE?

更新:

我認為我應該更清楚估計的 SE 是什麼。SPSS 中的 ANOVA 輸出為我estimated marginal means提供了相應的 SE 和 CI。這是左圖中繪製的內容。據我了解,它們應該是殘差的標準差。但是,當保存殘差時,它們的 SD 並不接近估計的 SE。所以第二個(可能是 SPSS 特定的)問題是:

這些 SE 是什麼?


**更新 2:**我終於設法編寫了一個 R 函數,它應該能夠根據我自己的最終喜歡它(請參閱我接受的答案)製作一個情節。如果有人有時間,如果您能看一下,我將不勝感激。這裡是。

作為對我的問題的啟發性答案和討論的結果,我構建了以下不依賴於任何基於模型的參數的圖,但呈現了基礎數據。

原因是與我可能選擇的任何類型的標準誤差無關,標準誤差是基於模型的參數。那麼,為什麼不呈現底層數據,從而傳遞更多信息呢?

此外,如果從方差分析中選擇 SE,我的具體問題會出現兩個問題。

首先(至少對我而言)不知何故不清楚SPSS方差分析輸出中的 SE 實際上是什麼(另見評論中的討論)。它們在某種程度上與 MSE 相關,但我不知道到底是什麼。

其次,它們僅在滿足基本假設時才合理。然而,如下圖所示,顯然違反了方差同質性的假設。

帶有箱線圖的地塊: 替代文字

包含所有數據點的圖: 替代文字

請注意,這兩組有點向左或向右錯位:向左演繹,向右歸納。均值仍以黑色繪製,背景中的數據或箱線圖以灰色繪製。左側和右側圖之間的差異在於均值的錯位是否與點或箱線圖相同,或者它們是否居中呈現。

抱歉,圖表質量不佳和缺少 x 軸標籤。

剩下的問題是,上述地塊中的哪一個是現在要選擇的地塊。我必須考慮一下並詢問我們論文的另一位作者。但現在,我更喜歡“手段錯位的點”。我仍然會對評論非常感興趣。


**更新:**經過一些編程後,我終於設法編寫了一個 R 函數來自動創建一個類似點的圖,其均值錯位。檢查出來(並給我發評論)

引用自:https://stats.stackexchange.com/questions/2067

comments powered by Disqus