Normal-Distribution
殘差的非正態性
我指的是這篇文章 ,它似乎質疑殘差正態分佈的重要性,認為這與異方差一起可以通過使用穩健的標準誤差來避免。
我已經考慮了各種轉換 - 根、日誌等 - 事實證明,所有這些都無法完全解決問題。
這是我的殘差的QQ圖:
數據
- *因變量:*已經使用對數變換(修復異常值問題和此數據中的偏度問題)
- 自變量:公司年齡和一些二元變量(指標)(稍後我有一些計數,用於作為自變量的單獨回歸)
Stata 中的
iqr
命令 (Hamilton) 沒有確定任何排除正態性的嚴重異常值,但下圖表明並非如此,Shapiro-Wilk 檢驗也是如此。
向圖表添加“類似測試的味道”的一種方法是在它們周圍添加置信範圍。在Stata我會這樣做:
sysuse nlsw88, clear gen lnw = ln(wage) reg lnw i.race grade c.ttl_exp##c.ttl_exp union predict resid if e(sample), resid qenvnormal resid, mean(0) sd(`e(rmse)') overall reps(20000) gen(lb ub) qplot resid lb ub, ms(oh none ..) c(. l l) /// lc(gs10 ..) legend(off) ytitle("residual") /// trscale(`e(rmse)' * invnormal(@)) /// xtitle(Normal quantiles)