格蘭傑因果檢驗的滯後順序
假設我正在考慮可能包含在我正在開發的 ARIMAX 模型中的幾個獨立變量。在擬合不同的變量之前,我想通過使用 Granger 檢驗篩選出表現出反向因果關係的變量(我正在使用R
granger.test
中的包中的函數MSBVAR
,儘管我相信其他實現類似)。我如何確定應該測試多少滯後?R 函數是:
granger.test(y, p)
,其中y
是數據框或矩陣,並且p
是滯後。原假設是過去的值無助於預測價值.
有什麼理由不在這裡選擇一個非常高的滯後(除了觀察的損失)?
請注意,我已經根據依賴時間序列的集成順序對數據框中的每個時間序列進行了區分。(例如,對我的依賴時間序列進行差分一次使其平穩。因此,我也對所有“獨立”時間序列進行了一次差分。)
權衡是在偏置和功率之間。滯後太少,由於殘差自相關,您的測試有偏差。太多,您允許對 null 的潛在虛假拒絕 - 一些隨機相關可能使其看起來像有助於預測. 這是否是一個實際問題取決於您的數據,我的猜測是傾斜得更高,但滯後長度總是可以確定如下:
格蘭傑因果關係總是必須在某些模型的背景下進行測試。在 R 中函數的特定情況下
granger.test
,模型在雙變量檢驗中具有兩個變量中每一個的 p 個過去值。所以它使用的模型是:傳統的選擇方式因為這個模型是用不同的值來嘗試這個回歸並使用跟踪每個滯後長度的 AIC 或 BIC。然後使用值再次運行測試在您的回歸中具有最低的 IC。
一般來說,模型中的滯後數可以不同和格蘭傑測試仍然是合適的。在實施的特定情況下
granger.test
,您必須限制兩者的相同數量的滯後。這是一個方便的問題,而不是理論上的必要性。由於兩個變量的滯後長度不同,您仍然可以使用 AIC 或 BIC 來選擇您的模型,您只需要比較許多組合滯後和滯後. 看到這個。只是一個額外的詞 - 因為格蘭傑檢驗是模型相關的,所以遺漏變量偏差可能是格蘭傑因果關係的一個問題。您可能希望在模型中包含所有變量,然後使用 Granger 因果關係排除它們的塊,而不是使用
granger.test
僅進行成對測試的函數。