Median

中位數統計量何時是足夠的統計量?

  • November 6, 2014

我在The Chemical Statistician上偶然看到一個評論,即樣本中位數通常可以作為足夠統計量的選擇,但是,除了一個或兩個觀測值等於樣本均值的明顯情況之外,我想不出另一個不平凡的和iid 樣本中位數足夠的情況。

在分佈的支持不依賴於未知參數 θ 的情況下,我們可以調用(Fréchet-Darmois-)Pitman-Koopman定理,即觀察的密度必然是指數族形式, $$ \exp{ \theta T(x) - \psi(\theta) }h(x) $$ 得出結論,由於自然充分統計量 $$ S=\sum_{i=1}^n T(x_i) $$ 也足夠小,那麼中位數應該是 $ S $ ,以及另一種方式,這是不可能的:修改觀察中的一個極值 $ x_1,\ldots,x_n $ , $ n>2 $ , 修改 $ S $ 但不修改中位數。因此,當 $ n>2 $ .

在另一種情況下,分佈的支持確實取決於未知參數 $ θ $ ,我對以下證明不太滿意:首先,我們可以考慮 wlog 時的簡單情況 $$ f(x|\theta) = h(x) \mathbb{I}{A\theta}(x) \tau(\theta) $$ 集合在哪裡 $ A_\theta $ 索引為 $ θ $ 表示支持 $ f(\cdot|\theta) $ . 在那種情況下,假設中位數是足夠的,分解定理意味著我們有 $$ \prod_{i=1}^n \mathbb{I}{A\theta}(x_i) $$ 是一個二進制( $ 0-1 $ ) 樣本中位數的函數 $$ \prod_{i=1}^n \mathbb{I}{A\theta}(x_i) = \mathbb{I}{B^n\theta}(\text{med}(x_{1:n})) $$ 實際上,因式分解中沒有額外的項,因為它也應該是(i)數據的二元函數和(ii)獨立於 $ \theta $ . 添加進一步的觀察 $ x_{n+1} $ 哪個值不會修改樣本中位數會導致矛盾,因為它可能在支持集內或支持集外,而 $$ \mathbb{I}{B^{n+1}\theta}(\text{med}(x_{1:n+1}))=\mathbb{I}{B^n\theta}(\text{med}(x_{1:n}))\times \mathbb{I}{A\theta}(x_{n+1}) $$

引用自:https://stats.stackexchange.com/questions/122917

comments powered by Disqus