Variance

為什麼標準差定義為方差的平方而不是 N 上的平方和的平方?

  • September 22, 2014

今天我教了一門統計學入門課,一個學生向我提出了一個問題,我在此將其改寫為:“為什麼標準差定義為方差的平方而不是 N 上的平方和的平方?”

我們定義總體方差:

和標準差:.

我們可以給予的解釋是它給出了總體中單位與總體均值的平均偏差.

然而,在 sd 的定義中,我們將平方和的 sqrt 通過. 學生提出的問題是為什麼我們不將平方和的 sqrt 除以反而。因此,我們得出了競爭公式:

該學生認為,這個公式看起來更像是與平均值的“平均”偏差,而不是除以如在. 我認為這個問題並不愚蠢。我想給學生一個答案,而不是說 sd 被定義為方差的 sqrt,即平均平方偏差。換句話說,為什麼學生應該使用正確的公式而不是按照她的想法?

這個問題與較舊的線程和此處提供的答案有關。那裡的答案分為三個方向:

  1. 是均方根 (RMS) 偏差,而不是與平均值的“典型”偏差(即,)。因此,它的定義不同。
  2. 它具有很好的數學特性。
  3. 此外, sqrt 會將“單位”恢復到其原始比例。但是,這也適用於,除以反而。

第 1 點和第 2 點都是支持 sd 作為 RMS 的論據,但我沒有看到反對使用. 什麼是說服入門級學生使用平均 RMS 距離的好論據從什麼意思?

至少有三個基本問題可以很容易地向初學者解釋:

  1. 甚至沒有為無限人口定義“新” SD。(在這種情況下可以聲明它總是等於 0,但這不會使它變得更有用。)
  2. 新 SD 的行為方式與隨機抽樣下的平均值不同。
  3. 儘管新的 SD可以在所有數學嚴謹性的情況下用於評估與平均值的偏差(在樣本和有限總體中),但它的解釋是不必要的複雜。

1、新SD的適用範圍有限

點 (1) 可以帶回家,即使是那些不精通積分的人,指出因為方差顯然是算術平均值(平方偏差),它對“無限”總體模型有一個有用的擴展,其中算術平均值存在的直覺仍然成立。因此,它的平方根——通常的 SD——在這種情況下也得到了很好的定義,並且在它作為方差的(非線性重新表達)的作用中同樣有用。然而,新的 SD 將該平均值除以任意大的 $ \sqrt{N} $ ,使其超出有限總體和有限樣本的泛化存在問題:應該 $ 1/\sqrt{N} $ 在這種情況下被視為平等?

2.新的SD不是平均數

任何值得稱為“平均值”的統計數據都應該具有隨著來自總體的隨機樣本大小的增加而收斂到總體值的特性。SD 的任何固定倍數都將具有此屬性,因為乘數將適用於計算樣本 SD 和總體 SD。(雖然不直接與 Alecos Papadopoulos 提供的論點相矛盾,但這一觀察表明該論點僅與實際問題相切。)然而,“新”SD 等於 $ 1/\sqrt{N} $ 倍於通常的,顯然收斂到 $ 0 $ 在所有情況下作為樣本量 $ N $ 變大。因此,儘管對於任何固定的樣本量 $ N $ 新的 SD(適當解釋)是對均值變化的完全充分測量,它不能被合理地認為是適用於所有樣本量的通用測量,具有相同的解釋,也不能正確地稱為“平均值”有用的意義。

3.新的SD解釋和使用複雜

考慮抽取(比如說)大小的樣本 $ N=4 $ . 在這些情況下,新的 SD 是 $ 1/\sqrt{N}=1/2 $ 倍於通常的 SD。因此,它享有類似的解釋,例如 68-95-99 規則的類似物(大約 68% 的數據應位於平均值的兩個新 SD 範圍內,其中 95%的數據應位於平均值的四個新 SD 範圍內,等等;和經典不等式的版本,例如切比雪夫的不等式將成立(不超過 $ 1/k^2 $ 的數據可能超過 $ 2k $ 偏離均值的新標準差);並且中心極限定理可以用新的 SD 類似地重述(一個除以 $ \sqrt{N} $ 乘以新的 SD 以標準化變量)。因此,在這種特定且明顯受限的意義上,*學生的提議沒有任何問題。*然而,困難在於這些陳述都包含——非常明確地—— $ \sqrt{N}=2 $ . 儘管這並沒有內在的數學問題,但它肯定會使最基本的統計定律的陳述和解釋複雜化。


值得注意的是,高斯和其他人最初將高斯分佈參數化為 $ \sqrt{2}\sigma $ , 有效使用 $ \sqrt{2} $ 乘以 SD 以量化正態隨機變量的傳播。這種歷史用途證明了使用其他固定倍數 SD 代替它的適當性和有效性。

引用自:https://stats.stackexchange.com/questions/116342

comments powered by Disqus