當我們計算均值和方差時，我們是否假設數據是正態分佈的？

October 25, 2020

當我們使用學校教授的兩個方程計算均值和方差時：

$ \mu = \frac{1}{N}\sum_{i=1}^N{x_i} $

$ \sigma^2 = \frac{1}{N}\sum_{i=1}^N{(x_i-\mu)^2} $

那麼我們是否假設數據是正態分佈的？由於方程來自正態分佈估計的最大似然，據我所知，它們應該。

不，這些方程直接來自預期值的均值和方差公式，將收集的數據視為總體。

$$ \mu = \mathbb{E}\big[X\big] $$

$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] $$

由於您的觀察次數有限，因此分佈是離散的， $ ^{\dagger} $ 期望值是一個總和。

$$ \mu = \mathbb{E}\big[X\big] = \sum_{i=1}^N p(x_i)x_i = \sum_{i=1}^N \dfrac{1}{N}x_i = \dfrac{1}{N}\sum_{i=1}^Nx_i $$

$$ \sigma^2 = \mathbb{E}\big[\big(X-\mu\big)^2\big] = \sum_{i=1}^N p(x_i)(x_i - \mu)^2 = \sum_{i=1}^N \dfrac{1}{N}(x_i - \mu)^2 = \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $$

（從 $ p(x_i) $ 到 $ \dfrac{1}{N} $ , 注意每個人 $ x_i $ 有概率 $ 1/N $ .)

這就是為什麼 $ \dfrac{1}{N}\sum_{i=1}^N (x_i - \mu)^2 $ 被稱為“人口”方差。如果您將觀察到的數據視為總體，它實際上就是總體方差。

$ ^{\dagger} $ 這是離散分佈的充分條件，但不是必要條件。泊松分佈是具有無限多個值的離散分佈的示例。

引用自：https://stats.stackexchange.com/questions/493548

comments powered by Disqus

當我們計算均值和方差時，我們是否假設數據是正態分佈的？

相關問答

對於所有類型的分佈，均值的 CDF 是否始終為 0.5？

有偏估計量的方差是否總是比無偏估計量小？

74% 概率高於平均值的示例分佈

如何估計相關觀測值的方差？

一個擁有非正態分佈數據的統計學家怎麼能比一個只有平均值的統計學家猜得好呢？

證明方差總是大於或等於零