為什麼標準誤的公式是這樣的?
所以只是“為什麼”是? 應該如何解釋/闡明擁有的原因在分母中。為什麼我們將樣本均值除以樣本量的平方根,直觀地說?以及如何/為什麼將其稱為標準“錯誤”。(問題同樣適用於總體的真實標準差:)
有沒有直觀的推導這可以說清楚嗎?
請假設您正在向一個了解平均值和样本量的 6 歲兒童解釋它:)
這是因為 $ \newcommand{\Var}{\operatorname{Var}}\newcommand{\Cov}{\operatorname{Cov}}\Var(X+Y) = \Var(X) + \Var(Y) + 2\cdot\Cov(X,Y) $ 並且對於一個常數 $ a $ , $ \Var( a X ) = a^2 \Var(X) $ .
因為我們假設個體觀察是獨立的 $ \Cov(X,Y) $ 術語是 $ 0 $ 並且由於我們假設觀測值是同分佈的,所有的方差都是 $ \sigma^2 $ . 所以
$ \Var( \frac{1}{n} \sum X_i ) = \frac{1}{n^2} \sum \Var(X_i) = \frac{1}{n^2} \times \sum_{i=1}^n \sigma^2= \frac{n}{n^2} \sigma^2 = \frac{\sigma^2}{n} $
當我們取其平方根時(因為在方差尺度上更難思考),我們得到 $ \dfrac{\sigma}{\sqrt{n}} $ .
更直觀地,想想 2 個統計課:首先,老師分配每個學生從一組帶有數字的圖塊中抽取一個大小為 10 的樣本(老師知道這個總體的真實平均值,但學生不知道’t) 併計算其樣本的平均值。第二位老師分配他/她的每個學生從同一組瓷磚中抽取大小為 100 的樣本併計算平均值。您是否希望每個樣本均值與總體均值完全匹配?或有所不同?您是否期望樣本均值的分佈在兩個類別中相同?還是二等艙往往更接近人口?這就是為什麼除以樣本量的函數是有意義的。平方根意味著我們有一個收益遞減規律,要將樣本量增加四倍所需的標準誤差減半。
至於名稱,全稱是“x-bar的抽樣分佈的估計標準差”;只需要說幾次,您就會喜歡使用縮短的表格。我不知道是誰首先用這種方式用“錯誤”代替了“偏差”,但它卡住了。標準差衡量個體觀察的變異性;標準誤差衡量參數估計的可變性(基於觀察)。