Estimation

在某種意義上,樣本均值是分佈均值的“最佳”估計嗎?

  • October 4, 2011

通過(弱/強)大數定律,給定一些獨立同分佈的樣本點的分佈,它們的樣本均值在概率和样本量上收斂到分佈均值 走向無窮大。

當樣本量是固定的,我想知道 LLN 估計器是否從某種意義上說,估算器是最好的嗎?例如,

  1. 它的期望是分佈均值,所以它是一個無偏估計量。它的方差是在哪裡是分佈方差。但它是UMVU嗎?
  2. 有什麼功能嗎這樣解決最小化問題:

換句話說,是最好的一些對比功能在最小對比框架中(參見Bickle 和 Doksum的“數理統計:基本思想和選定主題,第 1 卷”中的第 2.1 節“估計的基本啟發式”)。

例如,如果分佈已知/限制為來自高斯分佈族,則樣本均值將是分佈均值的 MLE 估計量,MLE 屬於最小對比框架,其對比函數是減去對數似然函數。 3. 有什麼功能嗎這樣解決最小化問題:

對於任何分佈的在某個家庭中分佈? 換句話說,是最好的一些丟失的功能和一些家庭決策理論框架中的分佈(參見Bickle 和 Doksum的“數理統計:基本思想和選定主題,第 1 卷”中的第 1.3 節“決策理論框架” )。

請注意,以上是我迄今為止所知道的“最佳”估計的三種不同解釋。如果您知道可能適用於 LLN 估算器的其他可能解釋,請不要猶豫提及這一點。

您的第二個問題的答案是肯定的:樣本均值是您的函數時的最小對比度估計量是,當 x 和 u 是實數時,或,當 x 和 u 是列向量時。這來自最小二乘理論或微積分。

在某些技術條件下,最小對比度估計量既一致又漸近正態。對於樣本均值,這已經從 LLN 和中心極限定理得出。我不知道最小對比度估計器在任何方面都是“最佳的”。最小對比度估計量的好處在於,許多穩健的估計量(例如中值、Huber 估計量、樣本分位數)都屬於這個家族,我們可以通過應用最小對比度估計量的一般定理得出結論,它們是一致且漸近正態的,所以只要我們檢查一些技術條件(儘管這通常比聽起來要困難得多)。

您在問題中沒有提到的一個最優性概念是效率,粗略地說,是關於您需要多大的樣本才能獲得對某種質量的估計。請參閱http://en.wikipedia.org/wiki/Efficiency_(statistics)#Asymptotic_efficiency以比較均值和中值的效率(均值更有效,但中值對異常值更穩健)。

對於第三個問題,如果對您找到 argmin 的函數集 f 沒有任何限制,我認為樣本均值不會是最優的。對於任何分佈 P,您可以將 f 固定為忽略’s 並最小化特定 P 的損失。樣本均值無法擊敗它。

Minimax 最優性是一個比你給出的條件更弱的條件:而不是問那個成為任何人的最佳功能在課堂上,你可以問具有最佳的最壞情況性能。也就是說,在 argmin 和期望之間,放入一個. 貝葉斯最優性是另一種方法:將先驗分佈放在, 並接管期望以及來自的樣本.

引用自:https://stats.stackexchange.com/questions/16507

comments powered by Disqus