Distributions
每個統計量是否都有抽樣分佈,而不僅僅是樣本均值?
我很好奇,因為大多數基本的本科統計參考只是通過提到抽樣分佈和均值的抽樣分佈來開始推論統計。我的問題是每個統計數據都有一個嗎?甚至樣本比例、樣本方差和標準差?
編輯:他們會是什麼樣子?
是的,每個統計數據都有一個抽樣分佈(儘管有些可能是退化的)。
他們會是什麼樣子?
統計數據的抽樣分佈 - 就像平均值一樣 - 通常取決於您開始時的總體分佈(當然還有樣本量)。
例如,在來自正態分佈的隨機樣本中,樣本方差是卡方隨機變量的倍數,因此樣本 sd 是chi隨機變量的倍數。
下面是來自正態分佈的 10000 個大小為 10 的樣本的樣本標準偏差的直方圖,以及真實的樣本分佈(比例尺,紅色曲線):
(點擊查看大圖)
如果您不從正常總體開始,則樣本 sd 的分佈是另一回事。例如,這是來自均勻分佈的 10000 個大小為 10 的樣本的樣本 sd:
正如我們所看到的,這個是輕微的左偏而不是輕微的右偏(我沒有計算它的理論分佈)。
另請注意,樣本比例是平均值的一種形式(用 1 標記類別內觀察值,用 0 標記類別外觀察值,樣本平均值是您開始時的樣本比例)。如果在組中的概率是恆定的並且觀察是獨立的,那麼它將具有離散的抽樣分佈;一個縮放的二項式。
許多統計數據在相當溫和的條件下是漸近正態的,但許多不是(例如,考慮一個樣本最大值)。
各種統計數據的抽樣分佈出現在許多情況下。例如,抽樣分佈在假設檢驗中很重要。