Regression

剛剛確定的 2SLS 中值無偏嗎?

  • March 10, 2017

大多數無害的計量經濟學:經驗主義者的伴侶(Angrist 和 Pischke,2009 年:第 209 頁)中,我讀到以下內容:

(…) 事實上,剛剛確定的 2SLS(例如,簡單的 Wald 估計器)是近似無偏的。這很難正式顯示,因為剛剛識別的 2SLS 沒有矩(即採樣分佈有肥尾)。然而,即使使用較弱的儀器,剛剛確定的 2SLS 也大致位於其應位於的中心位置。因此,我們說剛剛識別的 2SLS 是中值無偏的。(…)

儘管作者剛剛確定的 2SLS 是中值無偏的,但他們既沒有證明這一點,也沒有提供證明的參考。在第 213 頁,他們再次提到了這個命題,但沒有提到證明。此外,我在麻省理工學院關於工具變量的講義中找不到這個命題的動機,第 22 頁。

原因可能是該提議是錯誤的,因為他們在博客上的註釋中拒絕了它。然而,他們寫道,剛剛確定的 2SLS近似無偏中值。他們使用小型蒙特卡洛實驗來激發這一點,但沒有提供與近似值相關的誤差項的分析證明或封閉形式的表達。無論如何,這是作者對密歇根州立大學 Gary Solon 教授的回复,他評論說剛剛確定的 2SLS不是中值無偏的。

問題 1:你如何證明剛剛確定的 2SLS並非像 Gary Solon 所說的那樣是中值無偏的?

問題 2:如 Angrist 和 Pischke 所言,您如何證明剛剛確定的 2SLS近似無偏中位數?

對於問題 1,我正在尋找一個反例。對於問題 2,我(主要)正在尋找證明或證明的參考。

在這種情況下,我也在尋找中*值無偏的正式定義。*我對這個概念的理解如下:估計器的基於一些集合的隨機變量是中值無偏的當且僅當有中位數.


筆記

  1. 在剛剛確定的模型中,內生回歸變量的數量等於工具的數量。
  2. 描述剛剛確定的工具變量模型的框架可以表示如下: 感興趣的因果模型和第一階段方程是

在哪裡是一個矩陣描述內生回歸變量,其中工具變量由矩陣. 這裡僅描述一些控制變量(例如,添加以提高精度);和和是誤差項。 3. 我們估計在使用 2SLS:首先,回歸在控制並獲取預測值; 這稱為第一階段。其次,回歸在控制; 這稱為第二階段。估計係數第二階段是我們的 2SLS 估計. 4. 在最簡單的情況下,我們有模型

並測量內生回歸器和. 在這種情況下,2SLS 估計是在哪裡表示樣本之間的協方差和. 我們可以簡化:在哪裡,和, 在哪裡是觀察次數。 5. 我使用“just-identified”和“median-unbiased”這兩個詞進行了文獻檢索,以找到回答問題 1 和 2 的參考文獻(見上文)。我沒有找到。我發現的所有文章(見下文)都提到了 Angrist 和 Pischke(2009 年:第 209、213 頁)在聲明剛剛確定的 2SLS 是中值無偏的。

  • Jakiela, P.、Miguel, E. 和 Te Velde, VL (2015)。你已經贏得了它:估計人力資本對社會偏好的影響。實驗經濟學,18(3),385-407。
  • 安,W. (2015)。社交網絡中同伴效應的工具變量估計。社會科學研究,50,382-394。
  • Vermeulen, W. 和 Van Ommeren, J. (2009)。土地利用規劃會影響區域經濟嗎?對荷蘭住房供應、內部移民和當地就業增長的同步分析。住房經濟學雜誌,18(4),294-310。
  • Aidt, TS 和 Leon, G. (2016)。民主的機會之窗:來自撒哈拉以南非洲騷亂的證據。衝突解決雜誌,60(4),694-717。

在模擬研究中,術語中值偏差是指估計量與其真實值的偏差的絕對值(在這種情況下您知道,因為它是模擬,所以您選擇真實值)。您可以看到Young(2017)的工作論文,他在表 15 中定義了這樣的中值偏差,或者Andrews 和 Armstrong(2016)在圖 2 中繪製了不同估計量的中值偏差圖。

部分混淆(也在文獻中)似乎來自以下事實,即存在兩個獨立的潛在問題:

  1. 弱工具
  2. 許多(可能)弱工具

在剛剛確定的環境中擁有弱工具的問題與擁有許多弱工具的情況非常不同,但是,這兩個問題有時會放在一起。

首先,讓我們考慮一下我們在這裡討論的估計器之間的關係。Theil (1953) 在“完全方程系統中的估計和聯立相關”中介紹了所謂的-類估計器:

和, 對於方程組

標量決定了我們有什麼估算器。為了你回到OLS,因為你有 2SLS 估計器,當設置為的最小根你有 LIML 估計器(參見Stock and Yogo,2005 年,第 111 頁)

漸近地,LIML 和 2SLS 具有相同的分佈,但是,在小樣本中,這可能非常不同。當我們有許多儀器並且其中一些儀器很弱時尤其如此。在這種情況下,LIML 的性能優於 2SLS。此處的 LIML 已被證明是中值無偏的。這個結果來自大量的模擬研究。通常說明該結果的論文參考 Rothberg (1983) “Asymptotic Properties of Some Estimators In Structural Models”、Sawa (1972)Anderson 等人。(1982 年)

Steve Pischke 在他 2016 年第 17 張幻燈片上的筆記中對此結果進行了模擬,顯示了 OLS、LIML 和 2SLS 的分佈,其中有 20 種儀器,其中只有一種是真正有用的。真實係數值為 1。您會看到 LIML 以真實值為中心,而 2SLS 偏向於 OLS。 在此處輸入圖像描述

現在的論點似乎如下:假設 LIML 可以被證明是無偏的中位數,並且在剛剛確定的情況下(一個內生變量,一種工具)LIML 和 2SLS 是等價的,2SLS 也必須是無偏的中位數。

然而,人們似乎再次混淆了“弱工具”和“許多弱工具”的情況,因為在剛剛確定的設置中,當工具弱時,LIML 和 2SLS 都會有偏差。我沒有看到任何結果證明 LIML 在剛剛確定的情況下是無偏的,當儀器很弱時,我認為這不是真的。Angrist 和 Pischke (2009) 在第 2 頁對 Gary Solo 的回應得出了類似的結論,他們在改變樂器強度時模擬了 OLS、2SLS 和 LIML 的偏差。 在此處輸入圖像描述

對於 <0.1 的非常小的第一階段係數(保持標準誤差固定),即低儀器強度,與真實係數值為 1。

一旦第一階段係數介於 0.1 和 0.2 之間,他們注意到第一階段 F 統計量高於 10,因此根據 Stock 和 Yogo(2005)的 F>10 的經驗法則,不再存在弱工具問題。從這個意義上說,我看不出 LIML 應該如何解決剛剛確定的案例中的弱儀器問題。另請注意,i) LIML 往往更加分散,需要校正其標準誤差(參見 Bekker,1994 年)和 ii) 如果您的儀器實際上很弱,您將在第二階段找不到任何東西,無論是 2SLS 還是 LIML因為標準誤差太大了。

引用自:https://stats.stackexchange.com/questions/266699

comments powered by Disqus