Probability

對 Halmos-Savage 定理的直觀理解

  • June 2, 2018

Halmos-Savage 定理說,對於一個占主導地位的統計模型 $ (\Omega, \mathscr A, \mathscr P) $ 一個統計 $ T: (\Omega, \mathscr A, \mathscr P)\to(\Omega', \mathscr A') $ 當(且僅當)對所有人來說是足夠的 $ {P \in \mathscr{P} } $ 有一個 $ T $ - Radon Nikodym 導數的可測量版本 $ \frac{dP}{dP*} $ 在哪裡 $ dP* $ 是一種特權措施,使得 $ P*=\sum_{i=1}^\infty P_i c_i $ 為了 $ c_i >0, \sum _{i=1}^\infty c_i =1 $ 和 $ P_i \in \mathscr P $ .

我試圖直觀地理解為什麼這個定理是正確的但我沒有成功,所以我的問題是是否有一種直觀的方式來理解這個定理。

技術引理

我不確定這是多麼直觀,但您對 Halmos-Savage 定理的陳述背後的主要技術結果如下:

引理。 讓 $ \mu $ 做一個 $ \sigma $ - 有限測量 $ (S, \mathcal{A}) $ . 假設 $ \aleph $ 是關於措施的集合 $ (S, \mathcal{A}) $ 這樣對於每個 $ \nu \in \aleph $ , $ \nu \ll \mu $ . 那麼存在一個非負數序列 $ {c_i}{i=1}^\infty $ 和一系列元素 $ \aleph $ , $ {\nu_i}{i=1}^\infty $ 這樣 $ \sum_{i=1}^\infty c_i = 1 $ 和 $ \nu \ll \sum_{i=1}^\infty c_i \nu_i $ 對於每個 $ \nu \in \aleph $ .

這是從Schervish 的統計理論(1995)中的定理 A.78 中逐字記錄的。其中他將其歸因於 Lehmann 的測試統計假設(1986)(鏈接到第三版),其中結果歸因於Halmos 和 Savage自己(參見引理 7)。另一個很好的參考是邵氏數理統計(2003 年第二版),其中相關結果是引理 2.1 和定理 2.2。

上面的引理指出,如果你從一個由 $ \sigma $ -有限測度,那麼實際上您可以用族內測度的可數凸組合來代替主導測度。Schervish 在陳述定理 A.78 之前寫道,

“在統計應用中,我們經常會有一類測度,每一個都相對於一個單一的絕對連續的 $ \sigma $ - 有限的措施。如果單一的主導度量在原始類中或者可以從類中構造出來,那就太好了。下面的定理解決了這個問題。”

一個具體的例子

假設我們測量一個量 $ X $ 我們認為它在區間上均勻分佈 $ [0, \theta] $ 對於一些未知的 $ \theta > 0 $ . 在這個統計問題中,我們隱含地考慮了集合 $ \mathcal{P} $ 的 Borel 概率測度 $ \mathbb{R} $ 由形式的所有區間上的均勻分佈組成 $ [0, \theta] $ . 也就是說,如果 $ \lambda $ 表示勒貝格測度,並且,對於 $ \theta > 0 $ , $ P_\theta $ 表示 $ \operatorname{Uniform}([0, \theta]) $ 分佈(即, $$ P_\theta(A) = \frac{1}{\theta} \lambda(A \cap [0, \theta]) = \int_A \frac{1}{\theta} \mathbf{1}{[0, \theta]}(x) , dx $$ 對於每個 Borel $ A \subseteq \mathbb{R} $ ),那麼我們只需 $$ \mathcal{P} = {P\theta : \theta > 0}. $$ 這是我們測量的一組候選分佈 $ X $ .

家庭 $ \mathcal{P} $ 明顯受勒貝格測度支配 $ \lambda $ (這是 $ \sigma $ -有限),所以上面的引理(與 $ \aleph = \mathcal{P} $ ) 保證序列的存在 $ {c_i}{i=1}^\infty $ 非負數的總和為 $ 1 $ 和一個序列 $ {Q_i}{i=1}^\infty $ 的均勻分佈 $ \mathcal{P} $ 這樣 $$ P_\theta \ll \sum_{i=1}^\infty c_i Q_i $$ 對於每個 $ \theta > 0 $ . 在這個例子中,我們可以顯式地構造這樣的序列!

首先,讓 $ (\theta_i){i=1}^\infty $ 是正有理數的枚舉(這可以明確地完成),並讓 $ Q_i = P{\theta_i} $ 對於每個 $ i $ . 接下來,讓 $ c_i = 2^{-i} $ , 以便 $ \sum_{i=1}^\infty c_i = 1 $ . 我聲稱這種組合 $ {c_i}{i=1}^\infty $ 和 $ {Q_i}{i=1}^\infty $ 作品。

要看到這一點,請修復 $ \theta > 0 $ 然後讓 $ A $ 是一個 Borel 子集 $ \mathbb{R} $ 這樣 $ \sum_{i=1}^\infty c_i Q_i(A) = 0 $ . 我們需要證明 $ P_\theta(A) = 0 $ . 自從 $ \sum_{i=1}^\infty c_i Q_i(A) = 0 $ 並且每個加法都是非負的,因此 $ c_i Q_i(A) = 0 $ 對於每個 $ i $ . 此外,由於每個 $ c_i $ 為正,因此 $ Q_i(A) = 0 $ 對於每個 $ i $ . 也就是說,對於所有 $ i $ 我們有 $$ Q_i(A) = P_{\theta_i}(A) = \frac{1}{\theta_i} \lambda(A \cap [0, \theta_i]) = 0. $$ 由於每個 $ \theta_i $ 為正,因此 $ \lambda(A \cap [0, \theta_i]) = 0 $ 對於每個 $ i $ .

現在選擇一個子序列 $ {\theta_{i_k}}{k=1}^\infty $ 的 $ {\theta_i}{i=1}^\infty $ 收斂到 $ \theta $ 從上面(這可以做到,因為 $ \mathbb{Q} $ 密集在 $ \mathbb{R} $ )。然後 $ A \cap [0, \theta_{\theta_{i_k}}] \downarrow A \cap [0, \theta] $ 作為 $ k \to \infty $ ,因此通過測量的連續性,我們得出結論 $$ \lambda(A \cap [0, \theta]) = \lim_{k \to \infty} \lambda(A \cap [0, \theta_{i_k}]) = 0, $$ 所以 $ P_\theta(A) = 0 $ . 這證明了這一說法。

因此,在這個例子中,我們能夠顯式地構造一個可數的凸組合,該組合來自我們的被支配家庭,它仍然支配著整個家庭。上面的引理保證這對於任何被支配的家庭都可以做到(至少只要支配措施是 $ \sigma $ -有限)。

Halmos-Savage 定理

所以現在討論 Halmos-Savage 定理(由於個人喜好,我將使用與問題中略有不同的符號)。鑑於 Halmos-Savage 定理,Fisher-Neyman 分解定理只是 Doob-Dynkin 引理和 Radon-Nikodym 導數的鍊式法則的一種應用!

Halmos-Savage 定理。 讓 $ (\mathcal{X}, \mathcal{B}, \mathcal{P}) $ 是一個占主導地位的統計模型(意味著 $ \mathcal{P} $ 是一組概率測度 $ \mathcal{B} $ 並且有一個 $ \sigma $ - 有限度 $ \mu $ 在 $ \mathcal{B} $ 這樣 $ P \ll \mu $ 對所有人 $ P \in \mathcal{P} $ )。讓 $ T : (\mathcal{X}, \mathcal{B}) \to (\mathcal{T}, \mathcal{C}) $ 是一個可測量的函數,其中 $ (T, \mathcal{C}) $ 是標準 Borel 空間。那麼以下是等價的:

  1. $ T $ 足以 $ \mathcal{P} $ (意思是有一個概率核 $ r : \mathcal{B} \times \mathcal{T} \to [0, 1] $ 這樣 $ r(B, T) $ 是一個版本 $ P(B \mid T) $ 對所有人 $ B \in \mathcal{B} $ 和 $ P \in \mathcal{P} $ ).
  2. 存在一個序列 $ {c_i}{i=1}^\infty $ 的非負數,使得 $ \sum{i=1}^\infty c_i = 1 $ 和一個序列 $ {P_i}{i=1}^\infty $ 的概率測度 $ \mathcal{P} $ 這樣 $ P \ll P^* $ 對所有人 $ P \in \mathcal{P} $ , 在哪裡 $ P^* = \sum{i=1}^\infty c_i P_i $ ,並且對於每個 $ P \in \mathcal{P} $ 存在一個 $ T $ - 可測量的版本 $ dP/dP^* $ .

證明。 通過上面的引理,我們可以立即替換 $ \mu $ 經過 $ P^* = \sum_{i=1}^\infty c_i P_i $ 對於某些序列 $ {c_i}{i=1}^\infty $ 的非負數,使得 $ \sum{i=1}^\infty c_i = 1 $ 和一個序列 $ {P_i}_{i=1}^\infty $ 的概率測度 $ \mathcal{P} $ .

(1. 暗示 2.) 假設 $ T $ 足夠了。那麼我們必須證明有 $ T $ - 可測量的版本 $ dP/dP^* $ 對所有人 $ P \in \mathcal{P} $ . 讓 $ r $ 是定理陳述中的概率核。對於每個 $ A \in \sigma(T) $ 和 $ B \in \mathcal{B} $ 我們有 $$ \begin{aligned} P^(A \cap B) &= \sum_{i=1}^\infty c_i P_i(A \cap B) \ &= \sum_{i=1}^\infty c_i \int_A P_i(B \mid T) , dP_i \ &= \sum_{i=1}^\infty c_i \int_A r(B, T) , dP_i \ &= \int_A r(B, T) , dP^. \end{aligned} $$ 因此 $ r(B, T) $ 是一個版本 $ P^*(B \mid T) $ 對所有人 $ B \in \mathcal{B} $ .

對於每個 $ P \in \mathcal{P} $ , 讓 $ f_P $ 表示 Radon-Nikodym 導數的一個版本 $ dP/dP^* $ 在可測量空間上 $ (\mathcal{X}, \sigma(T)) $ (所以特別是 $ f_P $ 是 $ T $ - 可測量的)。那麼對於所有人 $ B \in \mathcal{B} $ 和 $ P \in \mathcal{P} $ 我們有 $$ \begin{aligned} P(B) &= \int_{\mathcal{X}} P(B \mid T) , dP \ &= \int_{\mathcal{X}} r(B, T) , dP \ &= \int_{\mathcal{X}} r(B, T) f_P , dP^* \ &= \int_{\mathcal{X}} P^(B \mid T) f_P , dP^ \ &= \int_{\mathcal{X}} E_{P^}[\mathbf{1}_B f_P \mid T] , dP^ \ &= \int_B f_P , dP^. \end{aligned} $$ 因此事實上 $ f_P $ 是一個 $ T $ - 可測量的版本 $ dP/dP^ $ 在 $ (\mathcal{X}, \mathcal{B}) $ . 這證明了定理的第一個條件隱含了第二個條件。

(2. 暗示 1.) 假設可以選擇一個 $ T $ - 可測量的版本 $ f_P $ 的 $ dP/dP^* $ 對於每個 $ P \in \mathcal{P} $ . 對於每個 $ B \in \mathcal{B} $ , 讓 $ r(B, t) $ 表示特定版本的 $ P^(B \mid T = t) $ (例如, $ r(B, t) $ 是一個函數,使得 $ r(B, T) $ 是一個版本 $ P^(B \mid T) $ )。自從 $ (T, \mathcal{C}) $ 是標準 Borel 空間,我們可以選擇 $ r $ 以使其成為概率核的方式(例如,參見 Schervish 的統計理論(1995) 中的定理 B.32)。我們將證明 $ r(B, T) $ 是一個版本 $ P(B \mid T) $ 對於任何 $ P \in \mathcal{P} $ 和任何 $ B \in \mathcal{B} $ . 因此,讓 $ A \in \sigma(T) $ 和 $ B \in \mathcal{B} $ 被給予。那麼對於所有人 $ P \in \mathcal{P} $ 我們有 $$ \begin{aligned} P(A \cap B) &= \int_A \mathbf{1}B f_P , dP^* \ &= \int_A E{P^}[\mathbf{1}_B f_P \mid T] , dP^ \ &= \int_A P^(B \mid T) f_P , dP^ \ &= \int_A r(B, T) f_P , dP^* \ &= \int_A r(B, T) , dP. \end{aligned} $$ 這表明 $ r(B, T) $ 是一個版本 $ P(B \mid T) $ 對於任何 $ P \in \mathcal{P} $ 和任何 $ B \in \mathcal{B} $ , 證明完成。

概括。 此處提出的 Halmos-Savage 定理背後的重要技術結果是,受支配的概率測度族實際上由該族的概率測度的可數凸組合支配。鑑於這個結果,Halmos-Savage 定理的其餘部分大多只是對 Radon-Nikodym 導數的基本性質和條件期望的操作。

引用自:https://stats.stackexchange.com/questions/349468

comments powered by Disqus