Density-Function
為什麼樣本的CDF是均勻分佈的
我在這裡讀到給出一個樣本來自 cdf 的連續分佈, 對應的樣本遵循標準均勻分佈。
我已經使用 Python 中的定性模擬驗證了這一點,並且我很容易能夠驗證這種關係。
import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)")
導致以下情節:
我無法理解為什麼會發生這種情況。我認為它與 CDF 的定義以及它與 PDF 的關係有關,但我遺漏了一些東西……
如果有人能指點我閱讀有關該主題的內容或幫助我對該主題有一些直覺,我將不勝感激。
編輯:CDF 看起來像這樣:
認為 $ F_X $ 是連續的和增加的。定義 $ Z = F_X(X) $ 並註意 $ Z $ 取值 $ [0, 1] $ . 然後 $$ F_Z(x) = P(F_X(X) \leq x) = P(X \leq F_X^{-1}(x)) = F_X(F_X^{-1}(x)) = x. $$
另一方面,如果 $ U $ 是一個均勻隨機變量,取值 $ [0, 1] $ , $$ F_U(x) = \int_R f_U(u),du =\int_0^x ,du =x. $$
因此 $ F_Z(x) = F_U(x) $ 對於每個 $ x\in[0, 1] $ . 自從 $ Z $ 和 $ U $ 具有相同的分佈函數 $ Z $ 也必須統一 $ [0, 1] $ .