什麼時候需要在回歸模型中包含因變量的滯後以及哪個滯後？

September 9, 2013

我們想要用作因變量的數據看起來像這樣（它是計數數據）。我們擔心，由於它具有循環成分和趨勢結構，因此回歸結果會以某種方式出現偏差。

如果有幫助，我們將使用負二項式回歸。數據是一個平衡的面板，每個人（州）一個假人。顯示的圖像顯示了所有狀態的因變量的總和，但大多數狀態單獨具有類似的行為。我們正在考慮一個固定效應模型。因變量的相關性不是很強，部分研究是在這些變量之間找到意想不到的關係，因此弱關係實際上是件好事。

不包括因變量的滯後變量的確切風險是什麼？

如果有必要包括一個，是否有一個測試可以知道是哪一個。？

正在 R 中進行實施。

注意：我確實閱讀了這篇文章，但它對我們的問題沒有幫助。

如果你有一個針對兇殺案的以眼還眼的報復模型，那麼動態面板模型可能是有意義的。例如，如果兇殺率主要是由幫派爭鬥推動的，那麼當時的謀殺很可能是死亡人數的函數，或其他滯後。

我會不按順序回答你的問題。假設 DGP 是

錯誤在哪裡和相互獨立，相互獨立。您有興趣進行是否測試（問題2）。

如果你使用 OLS，很容易看出並且誤差的第一部分是相關的，這使得 OLS 有偏差和不一致，即使在沒有序列相關的情況下. 我們需要更複雜的東西來做測試。

您可能會嘗試的下一件事是使用內部轉換的固定效應估計器，您可以通過減去每個單位的平均值來轉換數據,，從每個觀察。這抹掉了, 但這個估計量存在尼克爾偏差，該偏差不會隨著觀察次數的增加而消失增長，所以它是不一致的大和小面板。然而，作為增長，你得到一致性和. Judson 和 Owen (1999)做了一些模擬和並發現偏差在增加並減少. 然而，即使對於, 偏差可能高達的真實係數值。這是壞消息熊！因此，根據面板的尺寸，您可能希望避免使用 FE 估計器。如果，偏差為負，所以持久性被低估了。如果回歸量與滯後相關，則也會有偏見。

另一種簡單的有限元方法是對數據進行一階差分以去除固定效應，並使用為. 你也用作為自己的工具。Anderson and Hsiao (1981)是典型的參考文獻。這個估計量是一致的（只要解釋性s 是預先確定的，並且原始誤差項不是序列相關的），但不是完全有效的，因為它沒有使用所有可用的矩條件，也沒有使用誤差項現在不同的事實。這可能是我的第一選擇。如果你認為遵循 AR(1) 過程，可以使用第三和第四滯後反而。

Arellano 和 Bond (1991)推導出了一種更有效的廣義矩量法 (GMM) 估計器，此後該方法得到了擴展，放寬了一些假設。Baltagi 的面板書的第 8 章是對這些文獻的一個很好的綜述，儘管據我所知它並沒有涉及滯後選擇。這是最先進的指標，但對技術要求更高。

我認為 R 中的plm包內置了其中一些。動態面板模型自版本 10 以來一直在 Stata 中，而 SAS至少具有GMM 版本。這些都不是計數數據模型，但這可能不是什麼大問題，具體取決於您的數據。但是，這是 Stata 中 GMM 動態泊松面板模型的一個示例。

您的第一個問題的答案更具推測性。如果你忽略了滯後第一個區別，我相信仍然可以一致地估計，儘管由於方差現在更大，所以精度降低了。如果這是您關心的參數，那可能是可以接受的。你鬆懈的是，你不能說 X 區有很多兇殺案是因為上個月發生了很多，還是因為 X 區有暴力傾向。你放棄了區分狀態依賴和未觀察到的異質性的能力（問題 1）。

引用自：https://stats.stackexchange.com/questions/69570

comments powered by Disqus

什麼時候需要在回歸模型中包含因變量的滯後以及哪個滯後？

相關問答

為什麼要執行時間序列分解

固定效應的頻率論定義是什麼？

如何使用 arima.sim 進行漂移、截距和趨勢模擬

面板數據：合併 OLS 與 RE 與 FE 效應

在縱向研究中估計平均治療效果的最佳方法是什麼？

為什麼用回歸去趨勢時間序列是有效的？