樣本分位數對真實分位數是否無偏?
我想找到一種方法來顯示樣本分位數是否是真實分位數的無偏估計量。讓 $ F $ 嚴格隨密度函數增加 $ f $ . 我將定義 $ p $ -th 分位數 $ 0<p<1 $ 作為 $ Q(p)=F^{-1}(p) $ 和样本分位數為$$ \hat{F}_n^{-1}(p)=\inf{x:\hat{F}_n(x)\geq p}, $$在哪裡 $ \hat{F}_n(x) $ 是經驗分佈函數,由下式給出$$ \hat{F}n(x)=\frac{1}{n}\sum{i=1}^n I(X_i \leq x). $$根據我讀過的文獻,我希望樣本分位數有偏差,但我無法弄清楚如何取預期值 $ \hat{F}_n^{-1}(p) $ ,特別是因為它被定義為集合的下確界。我知道經驗分佈函數的期望值是 $ F(x) $ . 任何可以指導我的幫助或參考將不勝感激!
假如說 $ X_1, X_2, X_3 \sim \text{IID } F $ 經驗分佈函數具有縮放的二項分佈:
$$ \hat{F}_n(x) \sim \frac{1}{n} \cdot \text{Bin}(n, F(x)). $$
對於給定的概率值 $ 0 < p < 1 $ 我們將樣本分位數表示為:
$$ \hat{Q} \equiv \hat{Q}_n(p) \equiv \inf { x \in \mathbb{R} | \hat{F}_n(x) \geqslant p }. $$
由於經驗分佈函數 $ \hat{F}_n $ 是非遞減且右連續的,我們有事件等價 $ \inf { x \in \mathbb{R} | \hat{F}_n(x) \geqslant p } \leqslant q $ 當且僅當 $ \hat{F}_n(q) \geqslant p $ . 因此,樣本分位數的分佈函數為:
$$ \begin{equation} \begin{aligned} F_{\hat{Q}}(q) = \mathbb{P}(\hat{Q} \leqslant q) = \mathbb{P} \bigg( \inf { x \in \mathbb{R} | \hat{F}_n(x) \geqslant p } \leqslant q \bigg) = \mathbb{P} \big( \hat{F}_n(q) \geqslant p \big). \[6pt] \end{aligned} \end{equation} $$
為了將樣本分位數的偏差視為真實分位數的估計量,我們需要查看前者的期望值。使用此處顯示的一般期望規則,這個隨機變量的確切期望值可以寫成積分:
$$ \mathbb{E}(\hat{Q}) = \int \limits_{-\infty}^\infty \Big[ \mathbb{I}(q \geqslant 0) - F_{\hat{Q}}(q) \Big] dq = \int \limits_{-\infty}^\infty \Big[ \mathbb{I}(q \geqslant 0) - \mathbb{P} ( \hat{F}_n(q) \geqslant p ) \Big] dq. $$
這個積分是複雜的,由於比例二項分佈 $ \hat{F}_n $ . 然而,作為 $ n \rightarrow \infty $ 我們有 $ \hat{F}_n(q) \rightarrow F(q) $ ,所以如果 $ F $ 是連續的 $ q $ 那麼我們也有 $ Q(\hat{F}_n(q)) \rightarrow q $ . 這給出了漸近收斂:
$$ \mathbb{E}(\hat{Q}) \rightarrow \int \limits_{-\infty}^\infty \Big[ \mathbb{I}(q \geqslant 0) - \mathbb{I} ( q \geqslant Q(p) ) \Big] dq = \int \limits_{0}^{Q(p)} dq = Q(p), $$
只要 $ F $ 是連續的 $ p $ . 因此,您應該期望樣本分位數是漸近無偏的,除了對應於基礎分佈函數的不連續點的分位數。顯然,對於有限樣本,我們可能有非零偏差,偏差取決於基礎分佈的形式。