Sampling
中位數的無偏估計
假設我們有一個隨機變量支持我們可以從中抽取樣本。我們如何才能得出中位數的無偏估計?
當然,我們可以生成一些樣本並取樣本中值,但我知道這通常不會是無偏的。
注意:這個問題與我的上一個問題相關,但不完全相同,在這種情況下只能大致採樣。
這樣的估計器不存在。
直覺是,中位數可以保持固定,而我們可以在其兩側自由移動概率密度,因此平均值為一個分佈的中位數的任何估計器對於改變的分佈都有不同的平均值,從而使其有偏差。下面的說明更加嚴格地說明了這種直覺。
我們專注於分發具有唯一的中位數, 所以根據定義和對所有人. 固定樣本大小並假設估計. (這就足夠了僅是有界的,但通常不會認真考慮產生明顯不可能的值的估計量。)我們不做任何假設; 它甚至不必在任何地方都是連續的。
的含義不偏不倚(對於這個固定的樣本量)是
對於任何 iid 樣本. 一個“無偏估計”是一個具有此屬性的所有此類.
假設存在一個無偏估計量。我們將通過將其應用於一組特別簡單的分佈來得出一個矛盾。考慮分佈具有以下屬性:
- ;
- ;
- ;
- ;
- ; 和
- 是統一的.
這些分佈將概率在每個和和周圍對稱放置的少量概率之間和. 這使得的唯一中位數. (如果您擔心這不是連續分佈,則將其與非常窄的高斯進行卷積並將結果截斷為:論點不會改變。)
現在,對於任何假定的中值估計, 一個簡單的估計表明嚴格在的平均值價值觀在哪裡改變所有可能的組合和. 但是,我們可以改變之間和, 至少變化(根據條件 2 和 3)。因此存在一個, 以及對應的分佈,對此預期不等於中位數 QED。