Binary-Data

Probit 兩階段最小二乘法 (2SLS)

  • April 16, 2014

有人告訴我,可以運行兩階段 IV 回歸,其中第一階段是概率,第二階段是 OLS。如果第一階段是概率但第二階段是概率/泊松模型,是否可以使用 2SLS?

向您提出的建議有時被稱為禁止回歸,通常您不會始終如一地估計感興趣的關係。禁止回歸僅在非常嚴格的假設下產生一致的估計,而這些假設在實踐中很少成立(例如,參見 Wooldridge (2010) “Econometric Analysis of Cross Section an Panel Data”,第 265-268 頁)。

問題是條件期望算子和線性投影都沒有通過非線性函數。因此,只有第一階段的 OLS 回歸才能保證產生與殘差不相關的擬合值。對此的證明可以在 Greene (2008) “計量經濟學分析”中找到,或者,如果您想要更詳細(但也更技術性)的證明,您可以查看 Jean-Louis Arcand 在第 1 頁的註釋。47 至 52。

出於與禁止回歸相同的原因,這個看似明顯的用概率模擬 2SLS 的兩步過程不會產生一致的估計。這又是因為期望和線性預測不會通過非線性函數延續。Wooldridge (2010) 在第 594 頁的第 15.7.3 節中提供了對此的詳細解釋。他還解釋了用二元內生變量估計概率模型的正確程序。正確的方法是使用最大似然,但手動執行此操作並非微不足道。因此,如果您可以訪問一些具有現成封裝包的統計軟件,則更好。例如,Stata 命令將是ivprobit(請參閱該命令的 Stata手冊,其中也解釋了最大似然方法)。

如果您需要使用工具變量來了解概率背後的理論,請參見例如:

  • Newey, W. (1987) “有限因變量模型與內生解釋變量的有效估計”,計量經濟學雜誌,卷。36,第 231-250 頁
  • Rivers, D. 和 Vuong, QH (1988)“同時概率模型的有限信息估計器和外生性檢驗”,計量經濟學雜誌,卷。39,第 347-366 頁

最後,在第一階段和第二階段結合不同的估計方法是困難的,除非有理論基礎證明它們的使用是合理的。這並不是說它不可行。例如,亞當斯等人。(2009)使用三步程序,其中他們有一個概率“第一階段”和一個 OLS 第二階段,而不會陷入禁止回歸問題。他們的一般做法是:

  1. 使用概率回歸工具上的內生變量和控制變量
  2. 使用 OLS 第一階段中上一步的預測值以及控制(但沒有工具)變量
  3. 照常進行第二階段

Statalist 上的用戶使用了類似的程序,他想使用 Tobit 第一階段和 Poisson 第二階段(參見此處)。對於您的估計問題,相同的修復應該是可行的。

引用自:https://stats.stackexchange.com/questions/94063

comments powered by Disqus