Mathematical-Statistics

在單樣本 t 檢驗中,如果在方差估計器中將樣本均值替換為μ0μ0mu_0?

  • January 30, 2014

假設一個樣本 t 檢驗,其中原假設是. 那麼統計量是使用樣本標準差. 在估計, 將觀測值與樣本均值進行比較:

.

然而,如果我們假設一個給定的的確,人們也可以估計標準偏差使用而不是樣本均值:

.

對我來說,這種方法看起來更自然,因為我們因此也使用原假設來估計 SD。有誰知道結果統計數據是否用於測試或知道,為什麼不呢?

這篇文章中的原始模擬存在問題,希望現在已修復。

雖然樣本標準偏差的估計值隨著平均值的偏離而隨著分子的增加而增長,事實證明這對“典型”顯著性水平的功效沒有那麼大的影響,因為在中到大樣本中,仍然傾向於大到足以拒絕。但是,在較小的樣本中,它可能會產生一些影響,並且在非常小的顯著性水平上,這可能變得非常重要,因為它將為小於 1 的功率設置一個上限。

第二個問題,可能在“常見”顯著性水平上更重要,似乎是檢驗統計量的分子和分母在零點不再獨立(與方差估計相關)。

這意味著測試在零值下不再具有 t 分佈。這不是一個致命的缺陷,但它意味著你不能只使用表格來獲得你想要的顯著性水平(正如我們將在一分鐘內看到的那樣)。也就是說,測試變得保守,這會影響功率。

隨著 n 變大,這種依賴性就不再是一個問題(尤其是因為您可以為分子調用 CLT 並使用斯盧茨基定理來表示修改後的統計量存在漸近正態分佈)。

這是普通的兩個樣本 t(紫色曲線,兩個尾檢驗)和使用空值的檢驗的功效曲線在計算中(藍點,通過模擬和使用 t 表獲得),隨著總體平均值遠離假設值,對於:

n=10

在此處輸入圖像描述

您可以看到功效曲線較低(在較小的樣本量下會變得更糟),但其中大部分似乎是因為分子和分母之間的相關性降低了顯著性水平。如果您適當地調整臨界值,即使在 n=10 時它們之間也幾乎沒有。

這又是功率曲線,但現在

n=30

在此處輸入圖像描述

這表明,在非小樣本量下,它們之間的差異並不大,只要您不需要使用非常小的顯著性水平。

引用自:https://stats.stackexchange.com/questions/83921

comments powered by Disqus