為什麼樣本的CDF是均勻分佈的

July 15, 2015

我在這裡讀到給出一個樣本來自 cdf 的連續分佈, 對應的樣本遵循標準均勻分佈。

我已經使用 Python 中的定性模擬驗證了這一點，並且我很容易能夠驗證這種關係。
import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
   scipy.stats.norm.cdf(xs, 5, 2),
   bins=50
)
axes[1].set_title("CDF(samples)")
導致以下情節：

我無法理解為什麼會發生這種情況。我認為它與 CDF 的定義以及它與 PDF 的關係有關，但我遺漏了一些東西……

如果有人能指點我閱讀有關該主題的內容或幫助我對該主題有一些直覺，我將不勝感激。

編輯：CDF 看起來像這樣：

認為 $ F_X $ 是連續的和增加的。定義 $ Z = F_X(X) $ 並註意 $ Z $ 取值 $ [0, 1] $ . 然後 $$ F_Z(x) = P(F_X(X) \leq x) = P(X \leq F_X^{-1}(x)) = F_X(F_X^{-1}(x)) = x. $$

另一方面，如果 $ U $ 是一個均勻隨機變量，取值 $ [0, 1] $ , $$ F_U(x) = \int_R f_U(u),du =\int_0^x ,du =x. $$

因此 $ F_Z(x) = F_U(x) $ 對於每個 $ x\in[0, 1] $ . 自從 $ Z $ 和 $ U $ 具有相同的分佈函數 $ Z $ 也必須統一 $ [0, 1] $ .

引用自：https://stats.stackexchange.com/questions/161635

comments powered by Disqus

為什麼樣本的CDF是均勻分佈的

相關問答

對於所有類型的分佈，均值的 CDF 是否始終為 0.5？

在貝葉斯模型中，您可以使用 Uniform(-inf, inf) 作為先驗嗎？

實線上的均勻隨機數是有效分佈嗎？

如何確定隨機數生成器使用均勻分佈的可能性？

為什麼不以以下方式進行引導？

做什麼磷(|Xn-X|≥ε)磷(|Xn-X|≥ε)P(|X_n - X| geq epsilon)直觀地表示？