為什麼我們取方差的平方根來創建標準差?
抱歉,如果這已在其他地方得到解答,我無法找到它。
我想知道為什麼我們取平方根,特別是方差來創建標準偏差?取平方根會產生什麼有用的價值?
從某種意義上說,這是一個微不足道的問題,但從另一方面來說,它實際上是相當深刻的!
- 正如其他人所提到的,取平方根意味著 $ \operatorname{Stdev}(X) $ 具有相同的單位 $ X $ .
- 取平方根會給你絕對的同質性,也就是絕對的可擴展性。對於任何標量 $ \alpha $ 和隨機變量 $ X $ , 我們有: $$ \operatorname{Stdev}[\alpha X] = |\alpha| \operatorname{Stdev} $$ 絕對同質性是規範的必需屬性。標準差可以被解釋為一個範數(在均值零隨機變量的向量空間上),其方式類似 $ \sqrt{x^2 + y^2+z^2} $ 是三維空間中的標準歐幾里得範數。標準差是隨機變量與其均值之間距離的度量。
標準差和 $ L_2 $ 規範
有限維案例:
在一個 $ n $ 維向量空間,標準歐幾里得範數 $ L_2 $ 規範定義為:
$$ |\mathbf{x}|_2 = \sqrt{\sum_i x_i^2} $$
更廣泛地說, $ p $ -規範 $ |\mathbf{x}|_p = \left(\sum_i |x_i|^p \right)^{\frac{1}{p}} $ 採取 $ p $ th 根以獲得絕對同質性: $ |\alpha \mathbf{x}|_p = \left( \sum_i |\alpha x_i|^p \right)^\frac{1}{p} = | \alpha | \left( \sum_i |x_i|^p \right)^\frac{1}{p} = |\alpha | |\mathbf{x}|_p $ .
如果你有重量 $ q_i $ 然後是加權和 $ \sqrt{\sum_i x_i^2 q_i} $ 也是一個有效的規範。此外,它是標準偏差,如果 $ q_i $ 表示概率和 $ \operatorname{E}[\mathbf{x}] \equiv \sum_i x_i q_i = 0 $
無限維案例:
在無限維希爾伯特空間中,我們同樣可以定義 $ L_2 $ 規範:
$$ |X|2 = \sqrt{\int\omega X(\omega)^2 dP(\omega) } $$
如果 $ X $ 是一個均值為零的隨機變量,並且 $ P $ 是概率測度,標準差是多少?一樣的: $ \sqrt{\int_\omega X(\omega)^2 dP(\omega) } $ .
概括:
取平方根意味著標準差滿足絕對同質性,這是范數的必需屬性。
在隨機變量空間上, $ \langle X, Y \rangle = \operatorname{E}[XY] $ 是一個內積並且 $ |X|_2 = \sqrt{\operatorname{E}[X^2]} $ 由該內積引起的範數。因此標準差是貶低隨機變量的範數:$$ \operatorname{Stdev}[X] = |X - \operatorname{E}[X]|_2 $$ 它是距離平均值的度量 $ \operatorname{E}[X] $ 到 $ X $ .
(技術點:同時 $ \sqrt{\operatorname{E}[X^2]} $ 是范數,標準差 $ \sqrt{\operatorname{E}[(X - \operatorname{E}[X])^2]} $ 通常不是隨機變量的範數,因為對范數向量空間的要求是 $ |x| = \mathbf{0} $ 當且僅當 $ x = \mathbf{0} $ . 標準差為 0 並不意味著隨機變量是零元素。)