Probit

2SLS 與二元內生變量的一致性

  • November 28, 2014

我已經讀到 2SLS 估計器仍然與二進制內生變量一致(http://www.stata.com/statalist/archive/2004-07/msg00699.html)。在第一階段,將運行概率處理模型而不是線性模型。

是否有任何正式證據表明即使第一階段是概率或 logit 模型,2SLS 仍然是一致的?

另外,如果結果也是二元的怎麼辦?我知道如果我們有一個二元結果和二元內生變量(第一階段和第二階段都是二元概率/logit 模型),模仿 2SLS 方法將產生不一致的估計。這有什麼正式的證據嗎?伍爾德里奇的計量經濟學書有一些討論,但我認為沒有嚴格的證據表明這種不一致。

data sim;
    do i=1 to 500000;
       iv=rand("normal",0,1);
            x2=rand("normal",0,1);
       x3=rand("normal",0,1);
       lp=0.5+0.8*iv+0.5*x2-0.2*x3;
       T=rand("bernoulli",exp(lp)/(1+exp(lp)));
       Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
       output;
    end;
    run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
    model T=IV;
    output out=pred1 pred=p;
    run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
    model y=p;
    run;

的係數p = 1.19984。我只運行一次模擬,但樣本量很大。

關於 probit 第一階段和 OLS 第二階段也有類似的問題。在答案中,我提供了一個指向註釋的鏈接,其中包含該回歸不一致的正式證明,正式稱為“禁止回歸”,正如 Jerry Hausman 所說。probit第一階段/OLS第二階段方法不一致的主要原因是期望算子和線性投影算子都沒有通過非線性第一階段。因此,第一階段概率的擬合值僅在非常嚴格的假設下與第二階段誤差項不相關,而這些假設在實踐中幾乎從不成立。請注意,如果我沒記錯的話,禁止回歸的不一致的正式證明非常詳盡。

如果你有模型

在哪裡是一個連續的結果,並且是一個二元內生變量,可以運行第一階段

通過 OLS 並使用擬合值代替在第二階段。這是您所指的線性概率模型。鑑於此線性第一階段的預期或線性預測沒有問題,您的 2SLS 估計將是一致的,儘管效率低於我們考慮非線性性質時的效率。. 這種方法的一致性源於這樣一個事實,即雖然非線性模型可能更接近於有限因變量的條件期望函數,但如果您對邊際效應感興趣,這並不重要。在線性概率模型中,係數本身是在均值處評估的邊際效應,因此如果均值處的邊際效應是您所追求的(並且通常是人們所追求的),那麼這就是您想要的,因為線性模型給出了最好的線性非線性條件期望函數的近似。

如果也是二進制的。

有關此主題的更詳細討論,請查看 Kit Baum關於該主題的出色講義。在幻燈片 7 中,他討論了線性概率模型在 2SLS 環境中的使用。

最後,如果你真的想使用概率,因為你想要更有效的估計,那麼還有另一種方法,Wooldridge (2010) “橫截面和麵板數據的經濟計量分析”中也提到了這種方法。上面鏈接的答案包括它,為了完整起見,我在這裡重複一遍。作為一個應用示例,請參見Adams 等人。(2009)誰使用如下三步程序:

  1. 使用概率回歸工具上的內生變量和外生變量
  2. 使用 OLS 第一階段中上一步的預測值以及外生(但沒有工具)變量
  3. 照常進行第二階段

此過程不屬於禁止回歸問題,但可能會更有效地估計您感興趣的參數。

引用自:https://stats.stackexchange.com/questions/125830

comments powered by Disqus