Normal-Distribution
當我們計算均值和方差時,我們是否假設數據是正態分佈的?
當我們使用學校教授的兩個方程計算均值和方差時:
- $ \mu = \frac{1}{N}\sum_{i=1}^N{x_i} $
- $ \sigma^2 = \frac{1}{N}\sum_{i=1}^N{(x_i-\mu)^2} $
那麼我們是否假設數據是正態分佈的?由於方程來自正態分佈估計的最大似然,據我所知,它們應該。
不,這些方程直接來自預期值的均值和方差公式,將收集的數據視為總體。
$$ \mu = \mathbb{E}\big[X\big] $$
$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] $$
由於您的觀察次數有限,因此分佈是離散的, $ ^{\dagger} $ 期望值是一個總和。
$$ \mu = \mathbb{E}\big[X\big] = \sum_{i=1}^N p(x_i)x_i = \sum_{i=1}^N \dfrac{1}{N}x_i = \dfrac{1}{N}\sum_{i=1}^Nx_i $$
$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] = \sum_{i=1}^N p(x_i)(x_i - \mu)^2 = \sum_{i=1}^N \dfrac{1}{N}(x_i - \mu)^2 = \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $$
(從 $ p(x_i) $ 到 $ \dfrac{1}{N} $ , 注意每個人 $ x_i $ 有概率 $ 1/N $ .)
這就是為什麼 $ \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $ 被稱為“人口”方差。如果您將觀察到的數據視為總體,它實際上就是總體方差。
$ ^{\dagger} $ 這是離散分佈的充分條件,但不是必要條件。泊松分佈是具有無限多個值的離散分佈的示例。