如何計算均值的置信區間？

June 16, 2011

想像一下，你重複一個實驗 3 次。在每個實驗中，您收集三次測量值。與三個實驗方法之間的差異相比，一式三份往往相當接近。計算總平均值非常容易。但是如何計算大均值的置信區間呢？

樣本數據：

實驗一：34、41、39

實驗二：45、51、52

實驗三：29、31、35

假設實驗中的重複值遵循高斯分佈，每個實驗的平均值也是如此。實驗內變異的 SD 小於實驗均值之間的 SD。還假設每個實驗中的三個值沒有排序。每行中三個值的從左到右的順序完全是任意的。

簡單的方法是首先計算每個實驗的平均值：38.0、49.3 和 31.7，然後計算這三個值的平均值及其 95% 置信區間。使用這種方法，總平均值為 39.7，95% 置信區間為 17.4 至 61.9。

這種方法的問題在於它完全忽略了三次重複之間的變化。我想知道是否沒有一種很好的方法來解釋這種變化。

平衡隨機單向方差分析模型中的均值有一個自然的精確置信區間

實際上，很容易檢查觀察到的均值的分佈是和，並且眾所周知，平方和之間的有分佈並且獨立於觀察到的整體平均值. 因此有一個學生分佈與自由度，從中很容易得到一個準確的置信區間. 請注意，此置信區間只不過是高斯均值的經典區間，僅考慮組均值作為觀察。因此，您提到的簡單方法：

簡單的方法是首先計算每個實驗的平均值：38.0、49.3 和 31.7，然後計算這三個值的平均值及其 95% 置信區間。使用這種方法，總平均值為 39.7，95% 置信區間為 17.4 至 61.9。

是對的。你對被忽略的變化的直覺：

這種方法的問題在於它完全忽略了三次重複之間的變化。我想知道是否沒有一種很好的方法來解釋這種變化。

是錯的。我還在https://stats.stackexchange.com/a/72578/8402中提到了這種簡化的正確性

2014 年 12 月 4 日更新

一些細節現在寫在我的博客上：減少模型以獲得置信區間。

引用自：https://stats.stackexchange.com/questions/12002

如何計算均值的置信區間？

2014 年 12 月 4 日更新

相關問答

為什麼可以在貝葉斯多級模型中將人口統計建模為隨機效應？

(3 級) 2 級隨機截距和 3 級隨機斜率和隨機截距

借用信息究竟意味著什麼？

計算部分𝜂2這2eta^2對於來自 lme4 模型的所有固定效應方差分析

跨多個商店的數千種產品的產品需求預測

在縱向研究中估計平均治療效果的最佳方法是什麼？