Statistical-Significance
什麼時候應該在回歸中包含一個變量,儘管它在統計上不顯著?
我是一名經濟學學生,在計量經濟學和 R 方面有一些經驗。我想知道是否存在我們應該在回歸中包含變量的情況,儘管它在統計上不顯著?
是的!
一個係數在統計上與零無法區分並不意味著該係數實際上為零,該係數是不相關的。一個效應沒有通過某個統計顯著性的任意截止值並不意味著人們不應該嘗試控制它。
一般而言,手頭的問題和您的研究設計應該指導包含哪些作為回歸變量。
一些簡單的例子:
並且不要將其視為詳盡的清單。想出更多噸並不難…
1.固定效果
這種情況經常發生的情況是具有固定效應的回歸。
假設您有面板數據並想要估計在模型中:
用普通最小二乘法估計這個模型,其中被視為固定效應相當於運行普通最小二乘法,每個人都有一個指示變量.
無論如何,重點是變量(即指標變量的係數)的估計通常很差。任何單獨的固定效應往往在統計上不顯著。但是,如果您考慮固定效應,您仍然在回歸中包含所有指標變量。
(進一步注意,當您使用內置方法時,大多數統計數據包甚至不會為您提供單個固定效果的標準誤差。您並不真正關心單個固定效果的重要性。您可能確實關心它們的集體意義.)
- 功能齊頭並進…
(a) 多項式曲線擬合(在評論中提示@NickCox)
如果你正在安裝一個某個曲線的次多項式,您幾乎總是包含低階多項式項。
例如,如果您要擬合二階多項式,您將運行:
通常強迫是很奇怪的而是運行
但牛頓力學的學生將能夠想像例外情況。
(b) AR(p) 模型:
假設您正在估計一個 AR(p) 模型,您還將包括低階項。例如,對於 AR(2),您將運行:
運行起來會很奇怪:
(c) 三角函數
正如@NickCox 提到的,和術語同樣傾向於一起出現。有關這方面的更多信息,請參見例如本文。
更廣泛地…
當有充分的理論理由時,您希望包含右側變量。
正如此處和 StackExchange 中的其他答案所討論的那樣,逐步變量選擇會產生許多統計問題。
區分以下內容也很重要:
- 一個在統計上與零無法區分的係數,標準誤差很小。
- 一個在統計上與零無法區分的係數,具有很大的標準誤差。
在後一種情況下,爭論係數無關緊要是有問題的。它可能只是測量不佳。