Anova
從一組均值估計總體方差
我有一組測量值,它們被劃分為 M 個分區。但是,我只有分區大小和手段從每個分區。因為假設所有測量值都來自相同的分佈,所以我相信我可以估計總體的平均值,和均值的標準差,:
我的問題:
- 我的假設是對的嗎?可以如上計算嗎?
- 僅給定均值,如何找到總體的標準偏差?我讀到總體的標準偏差和平均值的標準偏差與
在哪裡是用於計算的樣本數. 那麼它實際上是否像乘法一樣簡單和如果因為所有的手段都是一樣的? 3. 如果就這麼簡單,我該怎麼辦?使用不同數量的樣本計算?
[1]維基百科:標準偏差
讓是平均值從一些未知分佈中獨立抽取有意思和標準差. 總而言之,這些值代表畫。根據這些假設,每個有期待和方差.
部分問題提出估計從這些數據中
我們可以驗證這是一個很好的估計。 首先,它是公正的:
其次,它的估計方差低。為了計算這個,我們找到了第二個時刻:
減去一階矩的平方表明,等於. 這是一個無偏線性估計器可能得到的最低值,因為它等於(未知)值,其中形成;已知抽樣方差在所有無偏線性估計器中是最小的;和任何線性組合更何況是基礎價值。
為了解決問題的其他部分,讓我們尋找方差的無偏估計量。以加權樣本方差的形式。將權重寫為. 以類似的方式計算我們得到
一個自然的選擇(受方差分析計算的啟發)是
因為確實,
這至少使不偏不倚。擁有超過組,還有許多其他的權重選擇可以提供無偏估計。當組大小相等時,很容易表明該選擇給出了最小方差無偏估計量。但總的來說,MVUE 似乎取決於. (我可能做錯了代數,但對於一般情況,我得到了一些複雜的結果。)無論如何,這裡提供的權重似乎不會遠離最佳。
作為一個具體的例子,假設每個,, 和是平均值畫。然後,,以及公式中給出的權重都是由. 因此我們應該估計
而且當然,