Regression
一致的估計 - 究竟與什麼一致?
讓我們假設,真實的 DGP(真實世界數據)是從模型中生成的:
$$ y_i = \beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \varepsilon_i $$
讓我們進一步假設, $ x_1 $ 和 $ x_2 $ 是相關的。恰恰, $ x_1 $ 是一個混雜變量,導致 $ x_2 $ :
$$ x_{2i} = \alpha_0 + \alpha_1 x_{1i} + u_i $$
研究人員不知道上述信息,他確信,真正的模型只有一個變量,並假設如下函數形式:
$$ y_i = \gamma_0 + \gamma_2x_{2i} + v_i $$
什麼都知道,我們能告訴我們估計量的一致性 $ \hat \gamma_2 $ ?
- 這是不一致的,因為一致的估計器在“真實世界參數”中有限制,在這種情況下是 $ \beta_2 $ .
- 它是一致的,因為一致的估計器在“假設模型”的參數中有限制。在這種情況下 $ \gamma_2 $ . 不適合現實世界的是模型,而不是估計器。
我看到了這兩種可能性。哪一個是(更多)正確的,什麼是最重要的——為什麼?
兩者都不。估計量對於某些參數是一致的,所以在這種情況下,答案是
- 是的, $ \hat\gamma_2 $ 是一致的 $ \beta_2 $
- 不, $ \hat\gamma_2 $ 不一致 $ \gamma_2 $ (或為 $ \beta_0 $ 或很多其他的東西)。
在這種情況下,因果假設表明你會對它是否一致更感興趣 $ \gamma_2 $ ,但你仍然需要說“一致 $ \gamma_2 $ ”,而不僅僅是“一致”。“有偏”和“無偏”也是如此:估計量對參數有偏或無偏
有時確實只有一個有趣的限制,將其隱含在合理地濫用符號是一種合理的濫用,但一致性聲明確實需要指定限制。