經驗 CDF 與 CDF
我正在學習經驗累積分佈函數。但我還是不明白
- 為什麼叫“經驗”?
- 經驗 CDF 和 CDF 之間有什麼區別嗎?
讓 $ X $ 是一個隨機變量。
- 累積分佈函數 $ F(x) $ 給出了 $ P(X \leq x) $ .
- 一個經驗累積分佈函數 function $ G(x) $ 給 $ P(X \leq x) $ 根據您樣本中的觀察結果。
區別在於使用了哪種概率度量。對於經驗 CDF,您使用由經驗樣本中的頻率計數定義的概率度量。
簡單示例(硬幣翻轉):
讓 $ X $ 是一個隨機變量,表示單個硬幣翻轉的結果,其中 $ X=1 $ 表示頭和 $ X=0 $ 表示尾巴。
公平硬幣的 CDF 由下式給出: $$ F(x) = \left{ \begin{array}{ll} 0 & \text{for } x < 0\ \frac{1}{2} & \text{for } 0 \leq x < 1 \1 & \text{for } 1 \leq x \end{array} \right. $$
如果你翻轉 2 個正面和 1 個反面,經驗 CDF 將是: $$ G(x) = \left{ \begin{array}{ll} 0 & \text{for } x < 0\ \frac{2}{3} & \text{for } 0 \leq x < 1 \1 & \text{for } 1 \leq x \end{array} \right. $$
經驗 CDF 將在您的樣本中反映這一點, $ 2/3 $ 你的翻轉是頭。
另一個例子 ( $ F $ 是正態分佈的 CDF):
讓 $ X $ 是具有均值的正態分佈隨機變量 $ 0 $ 和標準差 $ 1 $ .
CDF 由下式給出:
$$ F(x) = \int_{-\infty}^x \frac{1}{\sqrt{2\pi}} e^{\frac{-x^2}{2}} $$
假設您進行了 3 次 IID 抽籤並獲得了值 $ x_1 < x_2 < x_3 $ . 經驗 CDF 將是: $$ G(y) = \left{ \begin{array}{ll} 0 & \text{for } y < x_1\ \frac{1}{3} & \text{for } x_1 \leq y < x_2 \\frac{2}{3} & \text{for } x_2 \leq y < x_3 \1 & \text{for } x_3 \leq y \end{array} \right. $$
有了足夠的 IID 抽取(並且滿足某些規律性條件),經驗 CDF 將收斂於總體的基礎 CDF。