Regression
一致的估計 - 究竟與什麼一致?
讓我們假設,真實的 DGP(真實世界數據)是從模型中生成的:
yi=β0+β1x1i+β2x2i+εi
讓我們進一步假設, x1 和 x2 是相關的。恰恰, x1 是一個混雜變量,導致 x2 :
x2i=α0+α1x1i+ui
研究人員不知道上述信息,他確信,真正的模型只有一個變量,並假設如下函數形式:
yi=γ0+γ2x2i+vi
什麼都知道,我們能告訴我們估計量的一致性 ˆγ2 ?
- 這是不一致的,因為一致的估計器在“真實世界參數”中有限制,在這種情況下是 β2 .
- 它是一致的,因為一致的估計器在“假設模型”的參數中有限制。在這種情況下 γ2 . 不適合現實世界的是模型,而不是估計器。
我看到了這兩種可能性。哪一個是(更多)正確的,什麼是最重要的——為什麼?
兩者都不。估計量對於某些參數是一致的,所以在這種情況下,答案是
- 是的, ˆγ2 是一致的 β2
- 不, ˆγ2 不一致 γ2 (或為 β0 或很多其他的東西)。
在這種情況下,因果假設表明你會對它是否一致更感興趣 γ2 ,但你仍然需要說“一致 γ2 ”,而不僅僅是“一致”。“有偏”和“無偏”也是如此:估計量對參數有偏或無偏
有時確實只有一個有趣的限制,將其隱含在合理地濫用符號是一種合理的濫用,但一致性聲明確實需要指定限制。