如何計算均值的置信區間?
想像一下,你重複一個實驗 3 次。在每個實驗中,您收集三次測量值。與三個實驗方法之間的差異相比,一式三份往往相當接近。計算總平均值非常容易。但是如何計算大均值的置信區間呢?
樣本數據:
實驗一:34、41、39
實驗二:45、51、52
實驗三:29、31、35
假設實驗中的重複值遵循高斯分佈,每個實驗的平均值也是如此。實驗內變異的 SD 小於實驗均值之間的 SD。還假設每個實驗中的三個值沒有排序。每行中三個值的從左到右的順序完全是任意的。
簡單的方法是首先計算每個實驗的平均值:38.0、49.3 和 31.7,然後計算這三個值的平均值及其 95% 置信區間。使用這種方法,總平均值為 39.7,95% 置信區間為 17.4 至 61.9。
這種方法的問題在於它完全忽略了三次重複之間的變化。我想知道是否沒有一種很好的方法來解釋這種變化。
平衡隨機單向方差分析模型中的均值有一個自然的精確置信區間
實際上,很容易檢查觀察到的均值的分佈是和,並且眾所周知,平方和之間的有分佈並且獨立於觀察到的整體平均值. 因此有一個學生分佈與自由度,從中很容易得到一個準確的置信區間. 請注意,此置信區間只不過是高斯均值的經典區間,僅考慮組均值作為觀察。因此,您提到的簡單方法:
簡單的方法是首先計算每個實驗的平均值:38.0、49.3 和 31.7,然後計算這三個值的平均值及其 95% 置信區間。使用這種方法,總平均值為 39.7,95% 置信區間為 17.4 至 61.9。
是對的。你對被忽略的變化的直覺:
這種方法的問題在於它完全忽略了三次重複之間的變化。我想知道是否沒有一種很好的方法來解釋這種變化。
是錯的。我還在https://stats.stackexchange.com/a/72578/8402中提到了這種簡化的正確性
2014 年 12 月 4 日更新
一些細節現在寫在我的博客上:減少模型以獲得置信區間。