Standard-Error

推導標準誤的一般方法

  • March 7, 2014

我似乎無法在任何地方找到導出標準錯誤的通用方法。我在谷歌、這個網站甚至教科書上都看過,但我能找到的只是平均值、方差、比例、風險比等標準誤差的公式……而不是這些公式是如何得出的。

如果任何機構可以用簡單的術語解釋它,或者甚至將我鏈接到一個很好的資源來解釋它,我將不勝感激。

您要找到的是均值抽樣分佈的標準差。即,用簡單的英語來說,抽樣分佈是你選擇的時候人口中的項目,將它們加在一起,然後將總和除以. 我們然後找到這個量的方差,並通過取其方差的平方根來獲得標準偏差。

因此,讓您選擇的項目由隨機變量表示,它們中的每一個都具有方差同分佈. 它們是獨立採樣的,因此總和的方差只是方差的總和。

接下來我們除以. 我們一般都知道,所以放我們有

最後取平方根得到標準差. 當總體標準差不可用時,樣本標準差用作估計,給出.

以上所有內容都是正確的,無論其分佈如何s,但它引出了一個問題,即您實際上想對標準錯誤*做什麼?*通常,您可能想要構建置信區間,然後分配一個概率來構建包含均值的置信區間很重要。

如果你的s 是正態分佈的,這很容易,因為採樣分佈也是正態分佈的。您可以說 68% 的平均值樣本將在真實平均值的 1 個標準誤差範圍內,95% 將在 2 個標準誤差範圍內,等等。

如果您有足夠大的樣本(或較小的樣本並且s 不是太異常)然後您可以調用中心極限定理並說採樣分佈近似正態分佈,並且您的概率陳述也是近似的。

一個恰當的例子是估計一個比例, 你畫的地方每個項目都來自伯努利分佈。每個人的方差分佈是因此標準誤差是(比例是使用數據估計)。然後跳到說大約有 % 的樣本在均值的這麼多標準差範圍內,您需要了解採樣分佈何時接近正態。從伯努利分佈重複抽樣與從二項分佈抽樣相同,一個常見的經驗法則是僅在和是. (有關使用正態逼近二項式的更深入討論,請參閱維基百科。有關比例標準誤差的工作示例,請參見此處。)

另一方面,如果您的抽樣分佈不能近似為正態分佈,那麼標準誤差的用處就會少很多。例如,對於非常偏斜的非對稱分佈,您不能說相同百分比的樣本是均值兩側的標準差,您可能希望找到一種不同的方法將概率與樣本相關聯。

引用自:https://stats.stackexchange.com/questions/89154

comments powered by Disqus

相關問答