Regression

一致的估計 - 究竟與什麼一致?

  • October 22, 2020

讓我們假設,真實的 DGP(真實世界數據)是從模型中生成的:

$$ y_i = \beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \varepsilon_i $$

讓我們進一步假設, $ x_1 $ 和 $ x_2 $ 是相關的。恰恰, $ x_1 $ 是一個混雜變量,導致 $ x_2 $ :

$$ x_{2i} = \alpha_0 + \alpha_1 x_{1i} + u_i $$

研究人員不知道上述信息,他確信,真正的模型只有一個變量,並假設如下函數形式:

$$ y_i = \gamma_0 + \gamma_2x_{2i} + v_i $$

什麼都知道,我們能告訴我們估計量的一致性 $ \hat \gamma_2 $ ?

  • 這是不一致的,因為一致的估計器在“真實世界參數”中有限制,在這種情況下是 $ \beta_2 $ .
  • 它是一致的,因為一致的估計器在“假設模型”的參數中有限制。在這種情況下 $ \gamma_2 $ . 不適合現實世界的是模型,而不是估計器。

我看到了這兩種可能性。哪一個是(更多)正確的,什麼是最重要的——為什麼

兩者都不。估計量對於某些參數是一致的,所以在這種情況下,答案是

  • 是的, $ \hat\gamma_2 $ 是一致的 $ \beta_2 $
  • 不, $ \hat\gamma_2 $ 不一致 $ \gamma_2 $ (或為 $ \beta_0 $ 或很多其他的東西)。

在這種情況下,因果假設表明你會對它是否一致更感興趣 $ \gamma_2 $ ,但你仍然需要說“一致 $ \gamma_2 $ ”,而不僅僅是“一致”。“有偏”和“無偏”也是如此:估計量對參數有偏或無偏

有時確實只有一個有趣的限制,將其隱含在合理地濫用符號是一種合理的濫用,但一致性聲明確實需要指定限制。

引用自:https://stats.stackexchange.com/questions/493253

comments powered by Disqus