Median
中位數統計量何時是足夠的統計量?
我在The Chemical Statistician上偶然看到一個評論,即樣本中位數通常可以作為足夠統計量的選擇,但是,除了一個或兩個觀測值等於樣本均值的明顯情況之外,我想不出另一個不平凡的和iid 樣本中位數足夠的情況。
在分佈的支持不依賴於未知參數 θ 的情況下,我們可以調用(Fréchet-Darmois-)Pitman-Koopman定理,即觀察的密度必然是指數族形式, expθT(x)−ψ(θ)h(x)
得出結論,由於自然充分統計量 S=n∑i=1T(xi)也足夠小,那麼中位數應該是 S ,以及另一種方式,這是不可能的:修改觀察中的一個極值 x1,…,xn , n>2 , 修改 S 但不修改中位數。因此,當 n>2 .在另一種情況下,分佈的支持確實取決於未知參數 θ ,我對以下證明不太滿意:首先,我們可以考慮 wlog 時的簡單情況 $$ f(x|\theta) = h(x) \mathbb{I}{A\theta}(x) \tau(\theta) 集合在哪裡$Aθ$索引為$θ$表示支持$f(⋅|θ)$.在那種情況下,假設中位數是足夠的,分解定理意味著我們有
\prod_{i=1}^n \mathbb{I}{A\theta}(x_i) 是一個二進制($0−1$)樣本中位數的函數\prod_{i=1}^n \mathbb{I}{A\theta}(x_i) = \mathbb{I}{B^n\theta}(\text{med}(x_{1:n})) 實際上,因式分解中沒有額外的項,因為它也應該是(i)數據的二元函數和(ii)獨立於$θ$.添加進一步的觀察$xn+1$哪個值不會修改樣本中位數會導致矛盾,因為它可能在支持集內或支持集外,而\mathbb{I}{B^{n+1}\theta}(\text{med}(x_{1:n+1}))=\mathbb{I}{B^n\theta}(\text{med}(x_{1:n}))\times \mathbb{I}{A\theta}(x_{n+1}) $$