對 Halmos-Savage 定理的直觀理解
Halmos-Savage 定理說,對於一個占主導地位的統計模型 (Ω,A,P) 一個統計 T:(Ω,A,P)→(Ω′,A′) 當(且僅當)對所有人來說是足夠的 P∈P 有一個 T - Radon Nikodym 導數的可測量版本 dPdP∗ 在哪裡 dP∗ 是一種特權措施,使得 P∗=∑∞i=1Pici 為了 ci>0,∑∞i=1ci=1 和 Pi∈P .
我試圖直觀地理解為什麼這個定理是正確的但我沒有成功,所以我的問題是是否有一種直觀的方式來理解這個定理。
技術引理
我不確定這是多麼直觀,但您對 Halmos-Savage 定理的陳述背後的主要技術結果如下:
引理。 讓 μ 做一個 σ - 有限測量 (S,A) . 假設 ℵ 是關於措施的集合 (S,A) 這樣對於每個 ν∈ℵ , ν≪μ . 那麼存在一個非負數序列 $ {c_i}{i=1}^\infty 和一系列元素 \aleph , {\nu_i}{i=1}^\infty 這樣 \sum_{i=1}^\infty c_i = 1 和 \nu \ll \sum_{i=1}^\infty c_i \nu_i 對於每個 \nu \in \aleph $ .
這是從Schervish 的統計理論(1995)中的定理 A.78 中逐字記錄的。其中他將其歸因於 Lehmann 的測試統計假設(1986)(鏈接到第三版),其中結果歸因於Halmos 和 Savage自己(參見引理 7)。另一個很好的參考是邵氏數理統計(2003 年第二版),其中相關結果是引理 2.1 和定理 2.2。
上面的引理指出,如果你從一個由 σ -有限測度,那麼實際上您可以用族內測度的可數凸組合來代替主導測度。Schervish 在陳述定理 A.78 之前寫道,
“在統計應用中,我們經常會有一類測度,每一個都相對於一個單一的絕對連續的 σ - 有限的措施。如果單一的主導度量在原始類中或者可以從類中構造出來,那就太好了。下面的定理解決了這個問題。”
一個具體的例子
假設我們測量一個量 X 我們認為它在區間上均勻分佈 [0,θ] 對於一些未知的 θ>0 . 在這個統計問題中,我們隱含地考慮了集合 P 的 Borel 概率測度 R 由形式的所有區間上的均勻分佈組成 [0,θ] . 也就是說,如果 λ 表示勒貝格測度,並且,對於 θ>0 , Pθ 表示 Uniform([0,θ]) 分佈(即, $$ P_\theta(A) = \frac{1}{\theta} \lambda(A \cap [0, \theta]) = \int_A \frac{1}{\theta} \mathbf{1}{[0, \theta]}(x) , dx 對於每個Borel$A⊆R$),那麼我們只需
\mathcal{P} = {P\theta : \theta > 0}. $$ 這是我們測量的一組候選分佈 X .家庭 P 明顯受勒貝格測度支配 λ (這是 σ -有限),所以上面的引理(與 ℵ=P ) 保證序列的存在 $ {c_i}{i=1}^\infty 非負數的總和為 1 和一個序列 {Q_i}{i=1}^\infty 的均勻分佈 \mathcal{P} 這樣Pθ≪∑∞i=1ciQi對於每個 \theta > 0 $ . 在這個例子中,我們可以顯式地構造這樣的序列!
首先,讓 $ (\theta_i){i=1}^\infty $ 是正有理數的枚舉(這可以明確地完成),並讓 $ Q_i = P{\theta_i} 對於每個 i .接下來,讓 c_i = 2^{-i} ,以便 \sum_{i=1}^\infty c_i = 1 .我聲稱這種組合 {c_i}{i=1}^\infty 和 {Q_i}{i=1}^\infty $ 作品。
要看到這一點,請修復 θ>0 然後讓 A 是一個 Borel 子集 R 這樣 ∑∞i=1ciQi(A)=0 . 我們需要證明 Pθ(A)=0 . 自從 ∑∞i=1ciQi(A)=0 並且每個加法都是非負的,因此 ciQi(A)=0 對於每個 i . 此外,由於每個 ci 為正,因此 Qi(A)=0 對於每個 i . 也就是說,對於所有 i 我們有 Qi(A)=Pθi(A)=1θiλ(A∩[0,θi])=0.
由於每個 θi 為正,因此 λ(A∩[0,θi])=0 對於每個 i .現在選擇一個子序列 $ {\theta_{i_k}}{k=1}^\infty 的 {\theta_i}{i=1}^\infty 收斂到 \theta 從上面(這可以做到,因為 \mathbb{Q} 密集在 \mathbb{R} )。然後 A \cap [0, \theta_{\theta_{i_k}}] \downarrow A \cap [0, \theta] 作為 k \to \infty ,因此通過測量的連續性,我們得出結論λ(A∩[0,θ])=limk→∞λ(A∩[0,θik])=0,所以 P_\theta(A) = 0 $ . 這證明了這一說法。
因此,在這個例子中,我們能夠顯式地構造一個可數的凸組合,該組合來自我們的被支配家庭,它仍然支配著整個家庭。上面的引理保證這對於任何被支配的家庭都可以做到(至少只要支配措施是 σ -有限)。
Halmos-Savage 定理
所以現在討論 Halmos-Savage 定理(由於個人喜好,我將使用與問題中略有不同的符號)。鑑於 Halmos-Savage 定理,Fisher-Neyman 分解定理只是 Doob-Dynkin 引理和 Radon-Nikodym 導數的鍊式法則的一種應用!
Halmos-Savage 定理。 讓 (X,B,P) 是一個占主導地位的統計模型(意味著 P 是一組概率測度 B 並且有一個 σ - 有限度 μ 在 B 這樣 P≪μ 對所有人 P∈P )。讓 T:(X,B)→(T,C) 是一個可測量的函數,其中 (T,C) 是標準 Borel 空間。那麼以下是等價的:
- T 足以 P (意思是有一個概率核 r:B×T→[0,1] 這樣 r(B,T) 是一個版本 P(B∣T) 對所有人 B∈B 和 P∈P ).
- 存在一個序列 $ {c_i}{i=1}^\infty 的非負數,使得 \sum{i=1}^\infty c_i = 1 和一個序列 {P_i}{i=1}^\infty 的概率測度 \mathcal{P} 這樣 P \ll P^* 對所有人 P \in \mathcal{P} ,在哪裡 P^* = \sum{i=1}^\infty c_i P_i ,並且對於每個 P \in \mathcal{P} 存在一個 T −可測量的版本 dP/dP^* $ .
證明。 通過上面的引理,我們可以立即替換 μ 經過 P∗=∑∞i=1ciPi 對於某些序列 $ {c_i}{i=1}^\infty 的非負數,使得 \sum{i=1}^\infty c_i = 1 和一個序列 {P_i}_{i=1}^\infty 的概率測度 \mathcal{P} $ .
(1. 暗示 2.) 假設 T 足夠了。那麼我們必須證明有 T - 可測量的版本 dP/dP∗ 對所有人 P∈P . 讓 r 是定理陳述中的概率核。對於每個 A∈σ(T) 和 B∈B 我們有 $$ \begin{aligned} P^(A \cap B) &= \sum_{i=1}^\infty c_i P_i(A \cap B) \ &= \sum_{i=1}^\infty c_i \int_A P_i(B \mid T) , dP_i \ &= \sum_{i=1}^\infty c_i \int_A r(B, T) , dP_i \ &= \int_A r(B, T) , dP^. \end{aligned} $$ 因此 r(B,T) 是一個版本 P∗(B∣T) 對所有人 B∈B .
對於每個 P∈P , 讓 fP 表示 Radon-Nikodym 導數的一個版本 dP/dP∗ 在可測量空間上 (X,σ(T)) (所以特別是 fP 是 T - 可測量的)。那麼對於所有人 B∈B 和 P∈P 我們有 $$ \begin{aligned} P(B) &= \int_{\mathcal{X}} P(B \mid T) , dP \ &= \int_{\mathcal{X}} r(B, T) , dP \ &= \int_{\mathcal{X}} r(B, T) f_P , dP^* \ &= \int_{\mathcal{X}} P^(B \mid T) f_P , dP^ \ &= \int_{\mathcal{X}} E_{P^}[\mathbf{1}_B f_P \mid T] , dP^ \ &= \int_B f_P , dP^. \end{aligned} $$ 因此事實上 fP 是一個 T - 可測量的版本 $ dP/dP^ 在 (\mathcal{X}, \mathcal{B}) $ . 這證明了定理的第一個條件隱含了第二個條件。
(2. 暗示 1.) 假設可以選擇一個 T - 可測量的版本 fP 的 dP/dP∗ 對於每個 P∈P . 對於每個 B∈B , 讓 r(B,t) 表示特定版本的 $ P^(B \mid T = t) (例如, r(B, t) 是一個函數,使得 r(B, T) 是一個版本 P^(B \mid T) )。自從 (T, \mathcal{C}) 是標準Borel空間,我們可以選擇 r $ 以使其成為概率核的方式(例如,參見 Schervish 的統計理論(1995) 中的定理 B.32)。我們將證明 r(B,T) 是一個版本 P(B∣T) 對於任何 P∈P 和任何 B∈B . 因此,讓 A∈σ(T) 和 B∈B 被給予。那麼對於所有人 P∈P 我們有 $$ \begin{aligned} P(A \cap B) &= \int_A \mathbf{1}B f_P , dP^* \ &= \int_A E{P^}[\mathbf{1}_B f_P \mid T] , dP^ \ &= \int_A P^(B \mid T) f_P , dP^ \ &= \int_A r(B, T) f_P , dP^* \ &= \int_A r(B, T) , dP. \end{aligned} $$ 這表明 r(B,T) 是一個版本 P(B∣T) 對於任何 P∈P 和任何 B∈B , 證明完成。
概括。 此處提出的 Halmos-Savage 定理背後的重要技術結果是,受支配的概率測度族實際上由該族的概率測度的可數凸組合支配。鑑於這個結果,Halmos-Savage 定理的其餘部分大多只是對 Radon-Nikodym 導數的基本性質和條件期望的操作。