什麼時候需要在回歸模型中包含因變量的滯後以及哪個滯後?
我們想要用作因變量的數據看起來像這樣(它是計數數據)。我們擔心,由於它具有循環成分和趨勢結構,因此回歸結果會以某種方式出現偏差。
如果有幫助,我們將使用負二項式回歸。數據是一個平衡的面板,每個人(州)一個假人。顯示的圖像顯示了所有狀態的因變量的總和,但大多數狀態單獨具有類似的行為。我們正在考慮一個固定效應模型。因變量的相關性不是很強,部分研究是在這些變量之間找到意想不到的關係,因此弱關係實際上是件好事。
- 不包括因變量的滯後變量的確切風險是什麼?
- 如果有必要包括一個,是否有一個測試可以知道是哪一個。?
正在 R 中進行實施。
注意:我確實閱讀了這篇文章,但它對我們的問題沒有幫助。
如果你有一個針對兇殺案的以眼還眼的報復模型,那麼動態面板模型可能是有意義的。例如,如果兇殺率主要是由幫派爭鬥推動的,那麼當時的謀殺很可能是死亡人數的函數,或其他滯後。
我會不按順序回答你的問題。假設 DGP 是
錯誤在哪裡和相互獨立,相互獨立。您有興趣進行是否測試(問題2)。
如果你使用 OLS,很容易看出並且誤差的第一部分是相關的,這使得 OLS 有偏差和不一致,即使在沒有序列相關的情況下. 我們需要更複雜的東西來做測試。
您可能會嘗試的下一件事是使用內部轉換的固定效應估計器,您可以通過減去每個單位的平均值來轉換數據,,從每個觀察。這抹掉了, 但這個估計量存在尼克爾偏差,該偏差不會隨著觀察次數的增加而消失增長,所以它是不一致的大和小面板。然而,作為增長,你得到一致性和. Judson 和 Owen (1999)做了一些模擬和並發現偏差在增加並減少. 然而,即使對於, 偏差可能高達的真實係數值。這是壞消息熊!因此,根據面板的尺寸,您可能希望避免使用 FE 估計器。如果,偏差為負,所以持久性被低估了。如果回歸量與滯後相關,則也會有偏見。
另一種簡單的有限元方法是對數據進行一階差分以去除固定效應,並使用為. 你也用作為自己的工具。Anderson and Hsiao (1981)是典型的參考文獻。這個估計量是一致的(只要解釋性s 是預先確定的,並且原始誤差項不是序列相關的),但不是完全有效的,因為它沒有使用所有可用的矩條件,也沒有使用誤差項現在不同的事實。這可能是我的第一選擇。如果你認為遵循 AR(1) 過程,可以使用第三和第四滯後反而。
Arellano 和 Bond (1991)推導出了一種更有效的廣義矩量法 (GMM) 估計器,此後該方法得到了擴展,放寬了一些假設。Baltagi 的面板書的第 8 章是對這些文獻的一個很好的綜述,儘管據我所知它並沒有涉及滯後選擇。這是最先進的指標,但對技術要求更高。
我認為 R 中的
plm
包內置了其中一些。動態面板模型自版本 10 以來一直在 Stata 中,而 SAS至少具有GMM 版本。這些都不是計數數據模型,但這可能不是什麼大問題,具體取決於您的數據。但是,這是 Stata 中 GMM 動態泊松面板模型的一個示例。您的第一個問題的答案更具推測性。如果你忽略了滯後第一個區別,我相信仍然可以一致地估計,儘管由於方差現在更大,所以精度降低了。如果這是您關心的參數,那可能是可以接受的。你鬆懈的是,你不能說 X 區有很多兇殺案是因為上個月發生了很多,還是因為 X 區有暴力傾向。你放棄了區分狀態依賴和未觀察到的異質性的能力(問題 1)。