Standard-Deviation
為什麼要平方差而不是取標準差的絕對值?
在標準差的定義中,為什麼我們必須對均值的差進行平方才能得到均值(E)並在最後取平方根?難道我們不能簡單地取差值的絕對值,然後得到它們的期望值(平均值),那不也顯示數據的變化嗎?數字將不同於平方法(絕對值法會更小),但仍應顯示數據的分佈。有人知道為什麼我們以這種方形方法為標準嗎?
標準差的定義:
我們不能只取絕對值而仍然是一個很好的衡量標準嗎?
如果標準差的目標是總結對稱數據集的散佈(即通常每個數據與平均值的距離),那麼我們需要一種定義如何測量散佈的好方法。
平方的好處包括:
- 平方總是給出一個正值,所以總和不會為零。
- 平方強調更大的差異——一個既好又壞的特徵(想想異常值的影響)。
然而,平方作為價差的度量確實存在問題,即單位都是平方的,而我們可能更喜歡價差與原始數據的單位相同(想想平方磅、平方美元或平方蘋果) . 因此,平方根允許我們返回到原始單位。
我想您可以說絕對差異為數據的傳播分配了相同的權重,而平方則強調了極端。但是,正如其他人所指出的那樣,從技術上講,平方使代數更易於使用,並提供了絕對方法所沒有的屬性(例如,方差等於分佈平方的期望值減去分佈平方的平方)分佈的平均值)
重要的是要注意,如果這是您希望如何查看“價差”的偏好(有些人如何將 5% 視為一些神奇的閾值),那麼您沒有理由不能接受絕對差異。 $ p $ -值,而實際上它取決於情況)。事實上,實際上有幾種相互競爭的方法來測量價差。
我的觀點是使用平方值,因為我喜歡思考它與畢達哥拉斯統計定理的關係: $ c = \sqrt{a^2 + b^2} $ …這也幫助我記住,在使用獨立隨機變量時,方差會增加,標準偏差不會。但這只是我個人的主觀偏好,我主要用作記憶輔助,請隨意忽略這一段。
可以在這裡閱讀一個有趣的分析:
- 重溫一場 90 年前的辯論:平均偏差的優勢 - Stephen Gorard(約克大學教育研究系);2004 年 9 月 16 日至 18 日在曼徹斯特大學英國教育研究協會年會上發表的論文