Mean

單變量隨機變量的均值是否總是等於其分位數函數的積分?

  • November 15, 2011

我剛剛注意到,將單變量隨機變量的分位數函數(逆 cdf)從 p=0 積分到 p=1 會產生變量的平均值。我以前沒有聽說過這種關係,所以我想知道:總是這樣嗎?如果是這樣,這種關係是否廣為人知?

這是python中的一個例子:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
   return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
   return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

讓 $ F $ 是隨機變量的 CDF $ X $ , 所以逆 CDF 可以寫成 $ F^{-1} $ . 在您的積分中進行替換 $ p = F(x) $ , $ dp = F'(x)dx = f(x)dx $ 獲得

$$ \int_0^1F^{-1}(p)dp = \int_{-\infty}^{\infty}x f(x) dx = \mathbb{E}_F[X]. $$

這對連續分佈有效。必須注意其他分佈,因為逆 CDF 沒有唯一定義。

編輯

當變量不連續時,它不具有相對​​於 Lebesgue 測度絕對連續的分佈,因此需要注意逆 CDF 的定義和計算積分時的注意。例如,考慮離散分佈的情況。根據定義,這是一個其 CDF $ F $ 是一個步長為大小的階梯函數 $ \Pr_F(x) $ 在每個可能的值 $ x $ .

圖1

該圖顯示了伯努利的 CDF $ (2/3) $ 分佈按比例縮放 $ 2 $ . 即隨機變量有一個概率 $ 1/3 $ 相等的 $ 0 $ 和一個概率 $ 2/3 $ 相等的 $ 2 $ . 跳躍的高度在 $ 0 $ 和 $ 2 $ 給出他們的概率。這個變量的期望顯然等於 $ 0\times(1/3)+2\times(2/3)=4/3 $ .

我們可以定義一個“逆 CDF” $ F^{-1} $ 通過要求

$$ F^{-1}(p) = x \text{ if } F(x) \ge p \text{ and } F(x^{-}) \lt p. $$

這意味著 $ F^{-1} $ 也是階躍函數。對於任何可能的值 $ x $ 的隨機變量, $ F^{-1} $ 將達到價值 $ x $ 在一定長度的區間內 $ \Pr_F(x) $ . 因此,它的積分是通過對這些值求和獲得的 $ x\Pr_F(x) $ ,這只是預期。

圖 2

這是前面示例的逆 CDF 的圖。的跳躍 $ 1/3 $ 和 $ 2/3 $ 在 CDF 中成為這些長度的水平線,高度等於 $ 0 $ 和 $ 2 $ ,它們對應於其概率的值。(逆 CDF 未定義超出區間 $ [0,1] $ .) 它的積分是兩個矩形的總和,一個是高度 $ 0 $ 和基地 $ 1/3 $ , 另一個高度 $ 2 $ 和基地 $ 2/3 $ , 總計 $ 4/3 $ , 和以前一樣。

通常,對於連續分佈和離散分佈的混合,我們需要定義逆 CDF 以平行於這種構造:在每個離散的高度跳躍處 $ p $ 我們必須形成一條長度的水平線 $ p $ 由前面的公式給出。

引用自:https://stats.stackexchange.com/questions/18438

comments powered by Disqus