Standard-Deviation
在最小二乘的情況下偏向自然數
為什麼我們尋求最小化
x^2
而不是最小化|x|^1.95
or|x|^2.05
。有沒有理由為什麼這個數字應該正好是兩個,或者它只是一個具有簡化數學優勢的約定?
這個問題已經很老了,但我實際上有一個沒有出現在這裡的答案,並且給出了一個令人信服的理由,為什麼(在一些合理的假設下)平方誤差是正確的,而任何其他冪都是不正確的。
假設我們有一些數據並想找到線性(或其他)函數最好地預測數據,在某種意義上,概率密度觀察這個數據應該是最大的關於(這稱為最大似然估計)。如果我們假設數據由下式給出加上帶有標準偏差的正態分佈誤差項, 然後
這相當於
所以最大化是通過最小化來實現的,即平方誤差項的總和。