參數可估計性問題

December 16, 2017

讓和是四個隨機變量，使得，在哪裡是未知參數。還假設,那麼哪一個是真的呢？

一個。是可估計的。

B.是可估計的。

C。是可估計的並且是的最佳線性無偏估計.

D.是可估計的。

給出的答案是 C，這對我來說看起來很奇怪（因為我得到了 D）。

**為什麼我得了D？**自從，.

**為什麼我不明白 C 可能是一個答案？**好的，我可以看到，是一個無偏估計量, 其方差小於.

請告訴我我在哪裡做錯了。

還張貼在這裡：https ://math.stackexchange.com/questions/2568894/a-problem-on-estimability-of-parameters

這個答案強調可估計性的驗證。最小方差屬性是我的次要考慮因素。

首先，用線性模型的矩陣形式總結信息如下：
在哪裡（為了討論可估計性，不需要球形假設。但是為了討論高斯-馬爾可夫性質，我們確實需要假設球形）。

如果設計矩陣是滿秩的，那麼原始參數承認唯一的最小二乘估計 . 因此，任何參數 , 定義為線性函數的是可估計的，因為它可以通過最小二乘估計由數據明確估計作為 .

當微妙出現時不是滿級。為了進行徹底的討論，我們首先在下面修復一些符號和術語（我遵循線性模型的無坐標方法的約定，第 4.8 節。一些術語聽起來不必要的技術性）。此外，討論適用於一般線性模型和和 .

回歸流形是平均向量的集合變化超過： 2.參數泛函是一個線性泛函 ,

如上所述，當 , 不是每個參數泛函是可估計的。但是，等等，技術上可估計的術語的定義是什麼？如果不打擾一點線性代數，似乎很難給出一個清晰的定義。我認為最直觀的一個定義如下（來自上述相同的參考）：

***定義 1.***參數泛函是可估計的，如果它是唯一確定的在某種意義上說每當滿足 .

**解釋。**上面的定義規定了從回歸流形的映射到參數空間必須是一對一的，這保證了（即，當本身是一對一的）。什麼時候 , 我們知道存在這樣 . 上面的可估計定義實際上排除了那些導致不同值本身的結構缺陷參數泛函，即使在相同的值上，這自然沒有意義。另一方面，一個可估計的參數泛函確實允許這種情況和 , 只要條件被履行。

還有其他等效條件來檢查同一參考文獻中給出的參數泛函的可估計性，即命題 8.4。

經過這麼冗長的背景介紹，讓我們回到你的問題。

一個。本身是不可估計的，因為，這需要和 . 儘管上述定義是針對標量泛函給出的，但它很容易推廣到向量值泛函。

B. 是不可估量的。也就是說，考慮和，這使但 .

C。是可估計的。因為瑣碎地暗示， IE， .

D. 也是可想而知。派生自到也是微不足道的。

可估計性驗證後，有一個定理（命題 8.16，同參考）聲稱高斯-馬爾可夫性質 . 基於該定理，選項 C 的第二部分是不正確的。最好的線性無偏估計是，由下面的定理。

***定理。***讓是一個可估計的參數泛函，那麼它的最佳線性無偏估計（又名高斯-馬爾可夫估計）是對於任何解決方案到正規方程 .

證明如下：

*證明。*簡單的計算表明，正規方程是
簡化後是 IE， .

因此，選項 D 是唯一正確的答案。

附錄：可估計性和可識別性的聯繫

我在學校的時候，一位教授簡單地提到了參數泛函的可估計性對應於模型可識別性。我當時認為這種說法是理所當然的。但是，需要更明確地說明等效性。

根據 AC Davison 的專著Statistical Models p.144，

***定義 2.*一個參數模型，其中每個參數生成不同的分佈稱為可識別的。

對於線性模型 , 無論球麵條件如何 , 可以改寫為

這是一個如此簡單的模型，我們只指定了響應向量的一階矩形式 . 什麼時候，模型是可識別的，因為暗示（原定義中的“分佈”一詞，自然歸結為模型下的“均值” .)。

現在假設和給定的參數泛函，我們如何協調定義1和定義2？

好吧，通過操縱符號和單詞，我們可以證明（“證明”是相當微不足道的）相當於模型參數化時可識別（設計矩陣可能會相應改變）。為了證明，假設是可估計的，使得暗示，根據定義，這是 , 因此模型索引時可識別 . 相反，假設模型是可識別的，因此暗示，這是微不足道的 .

直覺上，當是降級的，模型與是參數冗餘（參數太多），因此非冗餘的低維重新參數化（可能由一組線性泛函組成）是可能的。這種新的代表什麼時候可能？關鍵是可估計性。

為了說明上述陳述，讓我們重新考慮您的示例。我們已經驗證了參數泛函和是可估計的。因此，我們可以重寫模型就重新參數化的參數而言如下

顯然，由於是滿排的，具有新參數的模型是可識別的。

引用自：https://stats.stackexchange.com/questions/319117

參數可估計性問題

附錄：可估計性和可識別性的聯繫

相關問答

如何估計相關觀測值的方差？

如何解釋 Pearl 的 do 表示法？

傾向得分匹配的用例是什麼？

當因變量不是正態分佈時，OLS 估計量遵循什麼分佈？

為什麼我們在進行 MLE 時將對數似然乘以 -2？

現實世界問題中的隨機抽樣和獨立性