為什麼卡方分佈的極限是正態分佈?
我的教授聲稱 limp→∞χ2p 具有正態分佈。該主張是根據中心極限定理提出的: p→∞ , 我們有一個 Normal (pμ,p2σ2) . 我看不出這是如何有效或真實的,因為這種說法有一個限制 p 在左側,然而 p 也出現在右手邊。此外, σ2 和 μ 兩者都取決於 p …
我錯過了什麼,如何讓自己相信這個限制的分佈?
該屬性來自中心極限定理,使用卡方分佈作為獨立標準正態隨機變量的平方和的分佈這一事實。如果你有一系列隨機變量 Z1,Z2,Z3,…∼IID N(0,1) 那麼你有: †
χ2p≡p∑i=1Z2i∼ChiSq(p).
現在,隨機變量 Z21,Z22,Z23,… 是 IID 均值 E(Z2i)=1 和方差 V(Z2i)=2<∞ ,所以我們有 E(χ2p)=p 和 V(χ2p)=2p . 應用經典中心極限定理,你得到:
limp→∞P(χ2p−p√2p⩽z)=Φ(z).
寫這個正式的限制結果的另一種方式是:
χ2p−p√2pDist→N(0,1).
這是適用於卡方分佈的正式收斂結果。非正式地,對於大 p∈N 我們有近似分佈:
χ2pApprox→N(p,2p).
雖然不是嚴格正確,但有時這種非正式近似被斷言為一種收斂結果,非正式地指的是收斂,其中 p 出現在兩邊。(或者有時通過添加適當的順序術語使其嚴格正確。)這大概是您的教授所指的。
關於這一性質,值得注意的是,隨著尺度參數趨於無窮大,伽馬分佈收斂於正態分佈;卡方分佈收斂到正態分佈是這種更廣泛收斂結果的特例。
† 作為旁注,人們通常通過以下方式進行更普遍的寫作:
χ2p=p∑i=1(Xi−μiσi)2,
在哪裡 Xi∼N(μi,σi) 是具有任意均值和方差的獨立高斯隨機變量。通過設置 Zi≡(Xi−μi)/σi ,我們可以改用任何獨立正態隨機變量的標準化版本來編寫上述公式。