Normal-Distribution

當我們計算均值和方差時,我們是否假設數據是正態分佈的?

  • October 25, 2020

當我們使用學校教授的兩個方程計算均值和方差時:

  1. $ \mu = \frac{1}{N}\sum_{i=1}^N{x_i} $
  2. $ \sigma^2 = \frac{1}{N}\sum_{i=1}^N{(x_i-\mu)^2} $

那麼我們是否假設數據是正態分佈的?由於方程來自正態分佈估計的最大似然,據我所知,它們應該。

不,這些方程直接來自預期值的均值和方差公式,將收集的數據視為總體。

$$ \mu = \mathbb{E}\big[X\big] $$

$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] $$

由於您的觀察次數有限,因此分佈是離散的, $ ^{\dagger} $ 期望值是一個總和。

$$ \mu = \mathbb{E}\big[X\big] = \sum_{i=1}^N p(x_i)x_i = \sum_{i=1}^N \dfrac{1}{N}x_i = \dfrac{1}{N}\sum_{i=1}^Nx_i $$

$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] = \sum_{i=1}^N p(x_i)(x_i - \mu)^2 = \sum_{i=1}^N \dfrac{1}{N}(x_i - \mu)^2 = \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $$

(從 $ p(x_i) $ 到 $ \dfrac{1}{N} $ , 注意每個人 $ x_i $ 有概率 $ 1/N $ .)

這就是為什麼 $ \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $ 被稱為“人口”方差。如果您將觀察到的數據視為總體,它實際上就是總體方差。

$ ^{\dagger} $ 這是離散分佈的充分條件,但不是必要條件。泊松分佈是具有無限多個值的離散分佈的示例。

引用自:https://stats.stackexchange.com/questions/493548

comments powered by Disqus