Econometrics

計量經濟學與其他統計領域之間的主要哲學、方法和術語差異是什麼?

  • October 14, 2011

計量經濟學與傳統統計學有大量重疊,但經常使用自己的術語來描述各種主題(“識別”、“外生”等)。我曾經聽到另一個領域的應用統計學教授評論說,術語經常不同,但概念是相同的。然而,它也有自己的方法和哲學區別(赫克曼的著名論文浮現在腦海中)。

計量經濟學和主流統計之間存在哪些術語差異,以及這些領域在哪些方面出現了分歧而不僅僅是術語上的差異?

存在一些術語差異,相同的事物在不同學科中被稱為不同的名稱:

  1. 生物統計學中的縱向數據是對同一個人的重複觀察=計量經濟學中的面板數據。
  2. 二元因變量的模型,其中 1 的概率被建模為 $ 1/(1+\exp[-x'\beta]) $ 在計量經濟學中稱為logit模型,在生物統計學中稱為logistic模型。生物統計學家傾向於根據優勢比使用邏輯回歸,因為他們的 $ x $ s 通常是二元的,因此優勢比表示總體中兩組感興趣的結果的相對頻率。這是一種常見的解釋,您經常會看到將連續變量轉換為兩類(低血壓與高血壓),以使這種解釋更容易。
  3. 統計學家的“估計方程”是計量經濟學家的“矩條件”。統計學家 $ M $ -estimates 是計量經濟學家的極值估計量。

在不同學科中使用相同的術語來表示不同的事物時,存在術語差異:

  1. 固定效果代表 $ x'\beta $ 在 ANOVA 統計學家的回歸方程中,對於計量經濟學家的縱向/面板數據模型中的“內部”估計量。(對於計量經濟學家來說,隨機效應永遠是詛咒的。)
  2. 穩健的推斷意味著經濟學家的異方差校正標準誤(擴展了聚類標準誤和/或自相關校正的標準誤)以及對統計學家的遠異常值穩健的方法。
  3. 經濟學家似乎有一個荒謬的想法,即分層樣本是那些在觀察之間選擇概率不同的樣本。這些應該稱為不等概率樣本。分層樣本是根據在抽樣之前已知的特徵將總體劃分為預定義組的樣本。
  4. 計量經濟學家的“數據挖掘”(至少在 1980 年代的文獻中)過去意味著多重測試和與之相關的陷阱,這些在Harrell 的書中得到了精彩的解釋。計算機科學家(和統計學家)的數據挖掘程序是在數據中尋找模式的非參數方法,也稱為統計學習
  5. Horvitz-Thompson 估計量是抽樣統計中有限總體總數的非參數估計量,它依賴於固定的選擇概率,方差由二階選擇概率確定。在計量經濟學中,它已經發展為表示依賴於標準因果推理假設(條件獨立、SUTVA、重疊,所有這些使魯賓的反事實有效的東西)的適度長列表的逆傾向加權估計量。是的,兩者的分母都有某種概率,但是在一種情況下理解估計量會使你理解另一種情況的能力為零。

我認為計量經濟學的獨特貢獻是

  1. 處理內生性和指定不明確的回歸模型的方法,正如 mpiktas在另一個答案中解釋的那樣,(i)解釋變量本身可能是隨機的(因此與回歸誤差相關,從而在參數估計中產生偏差),(ii)模型可能會受到遺漏變量的影響(然後成為誤差項的一部分),(iii)經濟主體對刺激的反應可能存在未觀察到的異質性,從而使標準回歸模型複雜化。Angrist & Pischke是對這些問題的精彩回顧,統計學家將從中學到很多關於如何進行回歸分析的知識。至少,統計學家應該學習和理解工具變量回歸。
  2. 更一般地說,經濟學家希望對他們的模型做出盡可能少的假設,以確保他們的發現不會依賴於像多元正態性這樣荒謬的東西。這就是為什麼 GMM 和經驗可能性在經濟學家中非常受歡迎,並且從未在統計中趕上(GMM 最初被描述為最小 $ \chi^2 $ Ferguson 和經驗可能性,Jon Rao,兩位著名的統計學家,在 1960 年代後期)。這就是為什麼經濟學家使用“穩健”的標準誤差進行回歸,而統計學家使用默認的 OLS 進行回歸 $ s^2 (X’X)^{-1} $ 標準錯誤。
  3. 在時間域中進行了大量工作,具有規則間隔的過程——這就是收集宏觀經濟數據的方式。獨特的貢獻包括集成和協整過程以及自回歸條件異方差 ((G)ARCH) 方法。作為一般的微觀人,我對這些不太熟悉。

總體而言,經濟學家傾向於在他們的模型中尋找對係數的有力解釋。統計學家會將邏輯模型作為獲得陽性結果概率的一種方法,通常作為一種簡單的預測工具,並且可能會注意到 GLM 解釋具有良好的指數族屬性,以及與判別分析的聯繫。經濟學家會考慮 logit 模型的效用解釋,並擔心只有 $ \beta/\sigma $ 在這個模型中被識別出來,並且異方差可以把它扔掉。(統計學家會想知道什麼 $ \sigma $ 當然,是經濟學家在談論。)當然,從微觀經濟學 101 的角度來看,輸入呈線性的效用是一件非常有趣的事情,儘管在 Mas-Collel 中可能對半凹函數進行了一些推廣。

經濟學家通常傾向於錯過,但恕我直言,會從中受益的是多元分析的各個方面(包括潛在變量模型作為處理測量誤差和多重代理的一種方式……不過,統計學家也忽略了這些模型) ,回歸診斷(所有這些庫克的距離,錦葵的 $ C_p $ , DFBETA 等),缺失數據分析(Manski 的部分識別肯定花哨,但主流的 MCAR/MAR/NMAR 分解和多重插補比較有用),調查統計。來自主流統計學的許多其他貢獻已經被計量經濟學所接受,或者作為一種標準方法被採用,或者作為一種短期時尚被傳遞:1960 年代的 ARMA 模型在計量經濟學中可能比在統計學中更為人所知,因為一些研究生課程這些天,統計學可能無法提供時間序列課程;1970 年代的收縮估計器/嶺回歸來了又去;1980 年代的 bootstrap 是對任何復雜情況的下意識反應,儘管經濟學家需要更好地意識到bootstrap 的局限性; 在 1990 年代的經驗可能性中,理論計量經濟學家比理論統計學家更多地發展了方法論;2000 年代的計算貝葉斯方法正在計量經濟學中得到應用,但我的感覺是它過於參數化,過於基於模型,無法與我之前提到的穩健性範式兼容。(編輯:這是 2012 年現場的觀點;到 2020 年,貝葉斯模型已成為實證宏觀的標準,人們可能不太關心穩健性,並且在實證微觀中也能聽到他們的存在。他們只是這些天太容易跑過去了。)經濟學家是否會發現在現代統計學中非常熱門的統計學習/生物信息學或時空數據的任何用途是公開的。

引用自:https://stats.stackexchange.com/questions/27662

comments powered by Disqus