Standard-Deviation

為什麼要平方差而不是取標準差的絕對值?

  • July 19, 2010

在標準差的定義中,為什麼我們必須對均值的差進行平方才能得到均值(E)並在最後取平方根?難道我們不能簡單地取差值的絕對值,然後得到它們的期望值(平均值),那不也顯示數據的變化嗎?數字將不同於平方法(絕對值法會更小),但仍應顯示數據的分佈。有人知道為什麼我們以這種方形方法為標準嗎?

標準差的定義:

我們不能只取絕對值而仍然是一個很好的衡量標準嗎?

如果標準差的目標是總結對稱數據集的散佈(即通常每個數據與平均值的距離),那麼我們需要一種定義如何測量散佈的好方法。

平方的好處包括:

  • 平方總是給出一個正值,所以總和不會為零。
  • 平方強調更大的差異——一個既好又壞的特徵(想想異常值的影響)。

然而,平方作為價差的度量確實存在問題,即單位都是平方的,而我們可能更喜歡價差與原始數據的單位相同(想想平方磅、平方美元或平方蘋果) . 因此,平方根允許我們返回到原始單位。

我想您可以說絕對差異為數據的傳播分配了相同的權重,而平方則強調了極端。但是,正如其他人所指出的那樣,從技術上講,平方使代數更易於使用,並提供了絕對方法所沒有的屬性(例如,方差等於分佈平方的期望值減去分佈平方的平方)分佈的平均值)

重要的是要注意,如果這是您希望如何查看“價差”的偏好(有些人如何將 5% 視為一些神奇的閾值),那麼您沒有理由不能接受絕對差異。 $ p $ -值,而實際上它取決於情況)。事實上,實際上有幾種相互競爭的方法來測量價差。

我的觀點是使用平方值,因為我喜歡思考它與畢達哥拉斯統計定理的關係: $ c = \sqrt{a^2 + b^2} $ …這也幫助我記住,在使用獨立隨機變量時,方差會增加,標準偏差不會。但這只是我個人的主觀偏好,我主要用作記憶輔助,請隨意忽略這一段。

可以在這裡閱讀一個有趣的分析:

引用自:https://stats.stackexchange.com/questions/118

comments powered by Disqus