Maximum-Likelihood

是 MLE 的θθtheta漸近正態時(X,和)∼和-(x/θ+θy)1x,y>0(X,是)∼和−(X/θ+θ是)1X,是>0(X,Y)sim e^{-(x/theta+theta y)}mathbf1_{x,y>`0}?

  • April 26, 2019

認為 (X,Y) 有pdf

fθ(x,y)=e(x/θ+θy)1x>0,y>0,,θ>0

樣品密度 (X,Y)=(Xi,Yi)1in 因此,從這個人口中抽取

gθ(x,y)=ni=1fθ(xi,yi)&=exp[ni=1(xiθ+θyi)]1x1,,xn,y1,,yn>0&=exp[nˉxθθnˉy]1x(1),y(1)>0,,θ>0

的最大似然估計 θ 可以導出為

ˆθ(X,Y)=¯X¯Y

我想知道這個 MLE 的極限分佈是否正常。

很明顯,有足夠的統計量 θ 基於樣本是 (¯X,¯Y) .

現在我會說 MLE 是漸近正態的,毫無疑問,如果它是正則單參數指數族的成員。我不認為是這種情況,部分原因是我們對一維參數有足夠的二維統計量(如 N(θ,θ2) 分佈,例如)。

利用這個事實 XY 實際上是獨立的指數變量,我可以證明 ˆθ 是這樣的

ˆθθd=F, where FF2n,2n

我不可能從這裡繼續找到限制分佈。

相反,我可以通過 WLLN 爭辯說 ¯XPθ¯YP1/θ , 以便 ˆθPθ .

這告訴我 ˆθ 分佈收斂到 θ . 但這並不奇怪,因為 ˆθ 是一個“好”的估計量 θ . 而且這個結果還不足以得出結論是否像 n(ˆθθ) 是否漸近正態。我也無法使用 CLT 提出合理的論點。

所以這裡的父分佈是否滿足 MLE 的極限分佈為正態的正則性條件仍然存在一個問題。

漸近正態性的直接證明:

這裡的對數似然是

L=nˉxθθnˉy

一階導數和二階導數是

Lθ=nˉxθ2nˉy,;;;2Lθ2=2nˉxθ3

MLE ˆθn 滿足

L(ˆθn)θ=0

在真值周圍應用平均值擴展 θ0 我們有

L(ˆθn)θ=L(θ0)θ+2L(˜θn)θ2(ˆθnθ0)=0

對於一些 ˜θn 介於兩者之間 ˆθnθ0 . 重新安排我們有,

(ˆθnθ0)=(2L(˜θn)θ2)1L(θ0)θ

但在我們的單參數情況下,倒數只是倒數,因此,還插入導數的特定表達式,

(ˆθnθ0)=˜θ3n2nˉx(nˉxθ20nˉy)

n(ˆθnθ0)=˜θ3n2ˉxθ20n(ˉxθ20ˉy)

n(ˆθnθ0)=˜θ3n2ˉxθ20(n1/2ni=1(xiθ20yi))

總和的方差為

Var(ni=1(xiθ20yi))=2nθ20

操縱我們可以寫的表達式,使用 Sn 對於 iid 元素的總和,

n(ˆθnθ0)=(˜θ3n2ˉxθ0)ni=1(xiθ20yi)n2θ0

n(ˆθnθ0)=(˜θ3n2ˉxθ0)SnVar(Sn)

更重要的是,我們有 E(xiθ20yi)=0 , 所以 E(Sn)=0 . 因此,我們有了經典 CLT 的主題,並且可以驗證 Lindeberg 條件是否滿足。它遵循

SnVar(Sn)dN(0,1)

由於估計量的一致性,我們也有

(˜θ3n2ˉxθ0)pθ02

根據斯盧茨基定理,我們得出

n(ˆθnθ0)dN(0,θ20/2)

好的。信息加倍,方差減半(與我們估計的情況相比 θ0 基於來自單個隨機變量的樣本)。

**PS:**事實上,在上面的表達式中 θ0 出現在分母中,指向@whuber 的評論,即 MLE 的漸近正態性需要未知參數遠離參數空間的邊界(在我們的例子中,遠離零)。

引用自:https://stats.stackexchange.com/questions/405189