Probability

“絕對連續隨機變量”與“連續隨機變量”?

  • August 16, 2017

在Valentin V. Petrov的《概率論的極限定理》一書中,我看到分佈的定義是“連續的”和“絕對連續的”之間的區別,如下所示:

  1. "…隨機變量的分佈 $ X $ 據說是連續的,如果 $ P\left(X \in B\right)=0 $ 對於任何有限或可數集 $ B $ 實線的點數。說它是絕對連續的,如果 $ P\left(X \in B\right)=0 $ 適用於所有 Borel 套件 $ B $ 勒貝格的測量為零……”

我熟悉的概念是:

  1. “如果一個隨機變量具有連續的累積分佈函數,那麼它就是絕對連續的。”

我的問題是:(1)和(2)中關於“絕對連續性”的兩個描述是在談論同一件事嗎?如果是,我如何將一種解釋翻譯成另一種解釋?

描述不同:只有第一個 $ (*) $ 是正確的。這個答案解釋瞭如何以及為什麼。


連續分佈

“連續”分佈 $ F $ 在通常意義上的連續函數中是連續的。 一個定義(通常是人們在教育中遇到的第一個定義)是對於每個 $ x $ 對於任何數字 $ \epsilon\gt 0 $ 存在一個 $ \delta $ (根據 $ x $ 和 $ \epsilon $ ) 其中的值 $ F $ 在 $ \delta $ - 鄰里 $ x $ 變化不超過 $ \epsilon $ 從 $ F(x) $ .

從這一步到證明當一個連續的 $ F $ 是隨機變量的分佈 $ X $ , 然後 $ \Pr(X=x)=0 $ 對於任何號碼 $ x $ . 畢竟,連續性定義意味著你可以收縮 $ \delta $ 使 $ \Pr(X\in (x-\delta, x+\delta)) $ 和任何一樣小 $ \epsilon \gt 0 $ 並且因為 (1) 這個概率不小於 $ \Pr(X=x) $ (2) $ \epsilon $ 可以任意小,因此 $ \Pr(X=x)=0 $ . 概率的可數可加性將此結果擴展到任何有限或可數集 $ B $ .

絕對連續分佈

所有分佈函數 $ F $ 定義積極的、有限的措施 $ \mu_F $ 取決於

$$ \mu_F((a,b]) = F(b) - F(a). $$

絕對連續性是測度論的一個概念。一項措施 $ \mu_F $ 相對於另一個測度絕對連續 $ \lambda $ (都在同一個 sigma 代數上定義)當,對於每個可測量的集合 $ E $ , $ \lambda(E)=0 $ 暗示 $ \mu_F(E)=0 $ . 換句話說,相對於 $ \lambda $ ,沒有“小”(測量零)集 $ \mu_F $ 分配“大”(非零)概率。

我們將採取 $ \lambda $ 是通常的勒貝格測度,對於 $ \lambda((a,b]) = b-a $ 是區間的長度。下半場 $ (*) $ 指出概率測度 $ \mu_F(B)=\Pr(X\in B) $ 關於 Lebesgue 測度是絕對連續的。

絕對連續性與可微性有關。 一種度量相對於另一種度量的導數(在某個點 $ x $ ) 是一個直觀的概念:取一組可測量的鄰域 $ x $ 縮小到 $ x $ 並比較這些社區的兩種措施。如果它們總是接近相同的極限,無論選擇什麼樣的鄰域序列,那麼這個極限就是導數。(有一個技術問題:您需要限制這些社區,使它們不具有“病態”形狀。這可以通過要求每個社區佔據其所在區域的不可忽略部分來實現。)

這種意義上的微分正是在什麼是連續分佈概率的定義中的問題?正在尋址。

讓我們寫 $ D_\lambda(\mu_F) $ 對於導數 $ \mu_F $ 關於 $ \lambda $ . 相關定理——它是微積分基本定理的測度論版本——斷言

$ \mu_F $ 是絕對連續的 $ \lambda $ 當且僅當$$ \mu_F(E) = \int_E \left(D_\lambda \mu_F\right)(x),\mathrm{d}\lambda $$對於每個可測量的集合 $ E $ . [魯丁,定理 8.6]

換句話說,絕對連續性( $ \mu_F $ 關於 $ \lambda $ ) 等價於密度函數的存在 $ D_\lambda(\mu_F) $ .

概括

  1. 一個分佈 $ F $ 是連續的,當 $ F $ 作為一個函數是連續的:直觀地說,它沒有“跳躍”。
  2. 一個分佈 $ F $ 當它具有密度函數時是絕對連續的(相對於勒貝格測度)。

這兩種連續性是不等價的,例如https://stats.stackexchange.com/a/229561/919中的例子。這就是著名的康托爾函數。對於這個功能, $ F $ 幾乎在任何地方都是水平的(如圖所示),從哪裡來 $ D_\lambda(\mu_F) $ 幾乎處處為零,因此 $ \int_{\mathbb{R}} D_\lambda(\mu_F)(x)d\lambda = \int_{\mathbb{R}}0 d\lambda = 0 $ . 這顯然沒有給出正確的值 $ 1 $ (根據總概率公理)。

評論

實際上,統計應用中使用的所有分佈都是絕對連續的、無處連續的(離散的)或它們的混合,因此通常忽略連續性和絕對連續性之間的區別。然而,未能意識到這種區別可能會導致推理混亂和直覺不佳,尤其是在最需要嚴謹的情況下:即當情況令人困惑或不直觀時,我們依靠數學來引導我們得出正確的結果。這就是為什麼我們在實踐中通常不會對這些東西大肆宣傳,但每個人都應該知道它。

參考

魯丁,沃爾特。 真實和復雜的分析。McGraw-Hill,1974:第 6.2 節(絕對連續性)和第 8.1 節(度量的導數)。

引用自:https://stats.stackexchange.com/questions/298293

comments powered by Disqus