Normal-Distribution

殘差的非正態性

  • July 4, 2013

我指的是這篇文章 ,它似乎質疑殘差正態分佈的重要性,認為這與異方差一起可以通過使用穩健的標準誤差來避免。

我已經考慮了各種轉換 - 根、日誌等 - 事實證明,所有這些都無法完全解決問題。

這是我的殘差的QQ圖:

正態圖

數據

  • *因變量:*已經使用對數變換(修復異常值問題和此數據中的偏度問題)
  • 自變量:公司年齡和一些二元變量(指標)(稍後我有一些計數,用於作為自變量的單獨回歸)

Stata 中的iqr命令 (Hamilton) 沒有確定任何排除正態性的嚴重異常值,但下圖表明並非如此,Shapiro-Wilk 檢驗也是如此。

向圖表添加“類似測試的味道”的一種方法是在它們周圍添加置信範圍。在Stata我會這樣做:

sysuse nlsw88, clear
gen lnw = ln(wage)

reg lnw i.race grade c.ttl_exp##c.ttl_exp union

predict resid if e(sample), resid

qenvnormal resid, mean(0) sd(`e(rmse)') overall reps(20000) gen(lb ub)

qplot resid lb ub, ms(oh none ..) c(. l l)     ///
   lc(gs10 ..) legend(off) ytitle("residual") ///
   trscale(`e(rmse)' * invnormal(@))          ///
   xtitle(Normal quantiles)

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/63321

comments powered by Disqus