單變量隨機變量的均值是否總是等於其分位數函數的積分?
我剛剛注意到,將單變量隨機變量的分位數函數(逆 cdf)從 p=0 積分到 p=1 會產生變量的平均值。我以前沒有聽說過這種關係,所以我想知道:總是這樣嗎?如果是這樣,這種關係是否廣為人知?
這是python中的一個例子:
from math import sqrt from scipy.integrate import quad from scipy.special import erfinv def normalPdf(x, mu, sigma): return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0)) def normalQf(p, mu, sigma): return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0) mu = 2.5 sigma = 1.3 quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0] print quantileIntegral # Prints 2.5.
讓 $ F $ 是隨機變量的 CDF $ X $ , 所以逆 CDF 可以寫成 $ F^{-1} $ . 在您的積分中進行替換 $ p = F(x) $ , $ dp = F'(x)dx = f(x)dx $ 獲得
$$ \int_0^1F^{-1}(p)dp = \int_{-\infty}^{\infty}x f(x) dx = \mathbb{E}_F[X]. $$
這對連續分佈有效。必須注意其他分佈,因為逆 CDF 沒有唯一定義。
編輯
當變量不連續時,它不具有相對於 Lebesgue 測度絕對連續的分佈,因此需要注意逆 CDF 的定義和計算積分時的注意。例如,考慮離散分佈的情況。根據定義,這是一個其 CDF $ F $ 是一個步長為大小的階梯函數 $ \Pr_F(x) $ 在每個可能的值 $ x $ .
該圖顯示了伯努利的 CDF $ (2/3) $ 分佈按比例縮放 $ 2 $ . 即隨機變量有一個概率 $ 1/3 $ 相等的 $ 0 $ 和一個概率 $ 2/3 $ 相等的 $ 2 $ . 跳躍的高度在 $ 0 $ 和 $ 2 $ 給出他們的概率。這個變量的期望顯然等於 $ 0\times(1/3)+2\times(2/3)=4/3 $ .
我們可以定義一個“逆 CDF” $ F^{-1} $ 通過要求
$$ F^{-1}(p) = x \text{ if } F(x) \ge p \text{ and } F(x^{-}) \lt p. $$
這意味著 $ F^{-1} $ 也是階躍函數。對於任何可能的值 $ x $ 的隨機變量, $ F^{-1} $ 將達到價值 $ x $ 在一定長度的區間內 $ \Pr_F(x) $ . 因此,它的積分是通過對這些值求和獲得的 $ x\Pr_F(x) $ ,這只是預期。
這是前面示例的逆 CDF 的圖。的跳躍 $ 1/3 $ 和 $ 2/3 $ 在 CDF 中成為這些長度的水平線,高度等於 $ 0 $ 和 $ 2 $ ,它們對應於其概率的值。(逆 CDF 未定義超出區間 $ [0,1] $ .) 它的積分是兩個矩形的總和,一個是高度 $ 0 $ 和基地 $ 1/3 $ , 另一個高度 $ 2 $ 和基地 $ 2/3 $ , 總計 $ 4/3 $ , 和以前一樣。
通常,對於連續分佈和離散分佈的混合,我們需要定義逆 CDF 以平行於這種構造:在每個離散的高度跳躍處 $ p $ 我們必須形成一條長度的水平線 $ p $ 由前面的公式給出。