Normal-Distribution

為什麼卡方分佈的極限是正態分佈?

  • October 3, 2019

我的教授聲稱 $ \lim_{p\to\infty}\chi^2_p $ 具有正態分佈。該主張是根據中心極限定理提出的: $ p\to\infty $ , 我們有一個 Normal $ (p\mu, p^2\sigma^2) $ . 我看不出這是如何有效或真實的,因為這種說法有一個限制 $ p $ 在左側,然而 $ p $ 也出現在右手邊。此外, $ \sigma^2 $ 和 $ \mu $ 兩者都取決於 $ p $ …

我錯過了什麼,如何讓自己相信這個限制的分佈?

該屬性來自中心極限定理,使用卡方分佈作為獨立標準正態隨機變量的平方和的分佈這一事實。如果你有一系列隨機變量 $ Z_1,Z_2,Z_3, … \sim \text{IID N}(0,1) $ 那麼你有: $ ^\dagger $

$$ \chi_p^2 \equiv \sum_{i=1}^p Z_i^2 \sim \text{ChiSq}(p). $$

現在,隨機變量 $ Z_1^2,Z_2^2,Z_3^2, … $ 是 IID 均值 $ \mathbb{E}(Z_i^2) = 1 $ 和方差 $ \mathbb{V}(Z_i^2) = 2 < \infty $ ,所以我們有 $ \mathbb{E}(\chi_p^2) = p $ 和 $ \mathbb{V}(\chi_p^2) = 2p $ . 應用經典中心極限定理,你得到:

$$ \lim_{p \rightarrow \infty} \mathbb{P} \Bigg( \frac{\chi_p^2 - p}{\sqrt{2p}} \leqslant z \Bigg) = \Phi(z). $$

寫這個正式的限制結果的另一種方式是:

$$ \frac{\chi_p^2 - p}{\sqrt{2p}} \overset{\text{Dist}}{\rightarrow} \text{N}(0, 1). $$

這是適用於卡方分佈的正式收斂結果。非正式地,對於大 $ p \in \mathbb{N} $ 我們有近似分佈:

$$ \chi_p^2 \overset{\text{Approx}}{\rightarrow} \text{N}(p, 2p). $$

雖然不是嚴格正確,但有時這種非正式近似被斷言為一種收斂結果,非正式地指的是收斂,其中 $ p $ 出現在兩邊。(或者有時通過添加適當的順序術語使其嚴格正確。)這大概是您的教授所指的。

關於這一性質,值得注意的是,隨著尺度參數趨於無窮大,伽馬分佈收斂於正態分佈;卡方分佈收斂到正態分佈是這種更廣泛收斂結果的特例。


$ ^\dagger $ 作為旁注,人們通常通過以下方式進行更普遍的寫作:

$$ \chi_{p}^{2} = \sum_{i = 1}^{p} \bigg( \frac{X_i - \mu_{i}}{\sigma_{i}} \bigg)^2, $$

在哪裡 $ X_{i} \sim \text{N}(\mu_i, \sigma_i) $ 是具有任意均值和方差的獨立高斯隨機變量。通過設置 $ Z_i \equiv (X_i - \mu_{i})/\sigma_{i} $ ,我們可以改用任何獨立正態隨機變量的標準化版本來編寫上述公式。

引用自:https://stats.stackexchange.com/questions/429782

comments powered by Disqus