Normal-Distribution

為什麼隨著樣本量的增加 t 分佈會變得更正態?

  • August 2, 2014

根據維基百科,我知道當樣本是來自正態分佈總體的獨立同分佈觀察時,t 分佈是 t 值的抽樣分佈。但是,我不直觀地理解為什麼這會導致 t 分佈的形狀從肥尾變為幾乎完全正常。

我知道,如果您從正態分佈中抽樣,那麼如果您抽取一個大樣本,它將類似於該分佈,但我不明白為什麼它以它的肥尾形狀開始。

我將嘗試給出一個直觀的解釋。

t-statistic* 有一個分子和一個分母。例如,單樣本 t 檢驗中的統計量是

*(有幾個,但希望這個討論足夠籠統,足以涵蓋您所詢問的內容)

在這些假設下,分子具有均值為 0 和一些未知標準差的正態分佈。

在同一組假設下,分母是對分子分佈的標準差的估計(分子上統計量的標準差)。它與分子無關。它的平方是卡方隨機變量除以其自由度(也是 t 分佈的 df)乘以.

當自由度較小時,分母往往是相當右偏的。它很有可能低於其平均值,並且相當有可能非常小。同時,它也有可能比其平均值大得多。

在正態性假設下,分子和分母是獨立的。因此,如果我們從該 t 統計量的分佈中隨機抽取,我們將得到一個正態隨機數除以從平均約為 1 的右偏分佈中隨機選擇的第二個值。

  • 不考慮正常術語

因為它在分母上,所以分母分佈中的小值會產生非常大的 t 值。分母的右偏使 t 統計量重尾。分佈的右尾,當在分母上時,使 t 分佈的峰值比具有與t相同標準差的正態分佈更尖銳。

然而,隨著自由度變大,分佈變得更加正常,並且在其均值附近更加“緊密”。

在此處輸入圖像描述

因此,除以分母對分子分佈形狀的影響隨著自由度的增加而減小。

最終——正如斯盧茨基定理可能向我們暗示的那樣——分母的影響變得更像是除以一個常數,並且 t 統計量的分佈非常接近正態分佈。


根據分母的倒數考慮

whuber 在評論中建議,看看分母的倒數可能更有啟發性。也就是說,我們可以將 t 統計量寫為分子(正常)乘以分母倒數(右偏)。

例如,我們上面的 one-sample-t 統計量將變為:

現在考慮原始的總體標準差,. 我們可以乘以它並除以它,如下所示:

第一項是標準正態。第二項(縮放的反卡方隨機變量的平方根)然後通過大於或小於 1 的值縮放標準正態,“將其展開”。

在正態假設下,產品中的兩項是獨立的。因此,如果我們從這個 t 統計量的分佈中隨機抽取,我們就有一個正態隨機數(乘積中的第一項)乘以來自右偏分佈的第二個隨機選擇的值(不考慮正態項),即 ‘通常在 1 左右。

當 df 較大時,該值往往非常接近 1,但當 df 較小時,它相當偏斜且散佈很大,該縮放因子的右大尾部使尾部相當肥:

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/110359

comments powered by Disqus