Variance

方差和均方誤差有什麼區別?

  • March 5, 2015

我很驚訝以前沒有人問過這個問題,但我在 stats.stackexchange 上找不到這個問題。

這是計算正態分佈樣本方差的公式:

這是計算簡單線性回歸中觀測值均方誤差的公式:

這兩個公式有什麼區別?我能看到的唯一區別是 MSE 使用. 因此,如果這是唯一的區別,為什麼不將它們都稱為方差,但具有不同的自由度呢?

您為 OLS 編寫的均方誤差隱藏了一些東西:

$$ \frac{\sum_{i}^{n}(y_i - \hat{y}i) ^2}{n-2} = \frac{\sum{i}^{n}\left[y_i - \left(\hat{\beta}{0} + \hat{\beta}{x}x_{i}\right)\right] ^2}{n-2} $$

請注意,分子對兩者的函數求和 $ y $ 和 $ x $ ,所以你失去了每個變量的自由度(或者如果你願意,每個估計的參數解釋一個變量作為另一個變量的函數),因此 $ n-2 $ . 在樣本方差的公式中,分子是單個變量的函數,因此分母只損失了一個自由度。

但是,您會注意到這些在概念上是相似的數量。樣本方差衡量數據在樣本均值周圍的分佈(以平方為單位),而 MSE 衡量數據在樣本回歸線周圍的垂直分佈(以平方垂直單位)。

引用自:https://stats.stackexchange.com/questions/140536

comments powered by Disqus