幫我理解分位數(逆 CDF)函數
我正在閱讀分位數函數,但我不清楚。您能否提供比下面提供的更直觀的解釋?
由於 cdf是一個單調遞增的函數,它有一個逆函數;讓我們用. 如果是的 cdf, 然後是的價值這樣; 這被稱為分位數. 價值是分佈的中位數,概率質量的一半在左邊,一半在右邊。價值 和是下四分位數和上四分位數。
所有這一切乍聽之下可能很複雜,但它本質上是關於一些非常簡單的事情。
通過累積分佈函數,我們表示返回概率的函數 $ X $ 小於或等於某個值 $ x $ ,
$$ \Pr(X \le x) = F(x). $$
此函數作為輸入 $ x $ 並從 $ [0, 1] $ 間隔(概率)——讓我們將它們表示為 $ p $ . 累積分佈函數(或分位數函數)的倒數告訴你什麼 $ x $ 將使 $ F(x) $ 返回一些值 $ p $ ,
$$ F^{-1}(p) = x. $$
下圖以正態累積分佈函數(及其反函數)為例說明了這一點。
例子
作為一個簡單的示例,您可以採用標準的Gumbel分佈。其累積分佈函數為
$$ F(x) = e^{-e^{-x}} $$
並且可以很容易地反轉:回憶自然對數函數是指數函數的反函數,因此很明顯, Gumbel 分佈的分位數函數是
$$ F^{-1}(p) = -\ln(-\ln(p)) $$
如您所見,分位數函數根據其替代名稱“反轉”累積分佈函數的行為。
廣義逆分佈函數
不是每個函數都有逆函數。這就是為什麼您引用的引用說“單調遞增函數”的原因。回想一下函數的定義,它必須為每個輸入值準確地分配一個輸出。連續隨機變量的累積分佈函數滿足這一性質,因為它們是單調遞增的。對於離散隨機變量,累積分佈函數不連續且遞增,因此我們使用需要非遞減的廣義逆分佈函數。更正式地說,廣義逆分佈函數定義為
$$ F^{-1}(p) = \inf \big{x \in \mathbb{R}: F(x) \ge p \big}. $$
這個定義,翻譯成簡單的英語,說對於給定的概率值 $ p $ ,我們正在尋找一些 $ x $ ,這導致 $ F(x) $ 返回值大於或等於然後 $ p $ ,但由於可能有多個值 $ x $ 滿足這個條件的(例如 $ F(x) \ge 0 $ 對任何人都是正確的 $ x $ ),所以我們取最小的 $ x $ 那些。
沒有逆的函數
一般來說,對於不同的輸入可以返回相同值的函數沒有逆函數,例如密度函數(例如,標準正態密度函數是對稱的,因此它返回相同的值 $ -2 $ 和 $ 2 $ 等等。)。正態分佈是一個有趣的例子還有一個原因——它是不具有封閉逆的累積分佈函數的例子之一。並非每個累積分佈函數都必須具有封閉形式的逆!希望在這種情況下,可以使用數值方法找到倒數。
用例
分位數函數可用於隨機生成,如逆變換方法如何工作?