Normal-Distribution
什麼時候分發(X¯¯¯-μ)/SE(X¯¯¯)(X¯−μ)/小號和(X¯)(overline{x}-mu)/{rm SE}(overline{x})正常,什麼時候噸噸t?
在估計總體的平均值時,兩種分佈似乎很有用,即正態分佈和 t 分佈。
這樣說是否正確遵循任何人口的正態分佈(不僅僅是正態分佈),只要樣本大小在大小上是顯著的(通過中心極限定理)?
而且,當樣本量較小時,t 服從 t 分佈是否正確,但只有當總體服從正態分佈時,總體才正確,因為中心極限定理不適用?
謝謝 !
這裡有一個微妙的問題,在關於估計標準偏差的問題中沒有提到的抽樣分佈。
假設您有一個來自具有均值的總體的樣本和方差. 什麼時候眾所周知,
正好是樣本均值的標準差。在實踐中,你通常不知道,因此您改為插入樣本方差使用估計標準差. 這種區別實際上很重要——當方差未知時,必須將這種額外的不確定性納入假設檢驗。這就是為什麼即使樣本是正態分佈的,檢驗統計量也有-分佈(具有更長的尾巴)而不是正態分佈,當是未知的。 這樣說是否正確遵循任何人口的正態分佈(不僅僅是正態分佈),只要樣本大小在大小上是顯著的(通過中心極限定理)
這幾乎是正確的。對於這種情況,總體必須具有有限的方差(即沒有“太長”的尾巴)。即使總體確實具有有限的方差,總體分佈也會對 CLT “開始”之前的時間產生很大影響。對於較短的尾分佈,這種收斂速度更快。對於長尾分佈,它可能需要相當長的時間(例如,請參閱我的示例here)。
請注意,由於我們在這裡討論的是“大樣本”結果,因此無論您是否知道,這都是正確的自從越來越接近真實隨著樣本量的增加。
而且,當樣本量較小時,t 遵循 t 分佈是否正確,但只有當總體服從正態分佈時,總體才正確,因為中心極限定理不適用?
同樣,假設我們在“是未知的”世界,只遵循一個-樣本正態分佈時的分佈,我認為這就是你在這裡所說的。與我一開始所說的有關,如果是已知的,那麼如果樣本是正態分佈的,則將具有(精確)正態分佈。
總結一下:
- 如果已知,並且總體服從正態分佈: 具有正態分佈。
- 如果是未知的,並且總體呈正態分佈: 有個-分配。
- 如果總體不是正態分佈但符合 CLT 的規律性要求: 是否具有近似正態分佈是已知的。也就是說,分佈 隨著樣本量的增加,收斂到正態分佈。