Normality-Assumption

我應該檢查什麼是正態性:原始數據或殘差?

  • June 18, 2011

我了解到我必須測試正態性,而不是原始數據,而是它們的殘差。我應該計算殘差然後做夏皮羅-威爾克的 W 檢驗嗎?

殘差計算如下:?

有關我的數據和設計,請參閱上一個問題

為什麼必須測試正態性?

線性回歸中的標准假設是理論殘差是獨立且正態分佈的。觀察到的殘差是對理論殘差的估計,但不是獨立的(殘差上有一些變換可以消除一些依賴性,但仍然只給出真實殘差的近似值)。因此,對觀察到的殘差進行測試並不能保證理論殘差匹配。

如果理論殘差不是完全正態分佈,但樣本量足夠大,則中心極限定理表明基於正態假設的通常推斷(測試和置信區間,但不一定是預測區間)仍將近似正確.

另請注意,正態性檢驗是排除檢驗,它們可以告訴您數據不太可能來自正態分佈。但是,如果檢驗不顯著並不意味著數據來自正態分佈,也可能意味著您沒有足夠的能力看到差異。樣本量越大,檢測非正態性的能力就越強,但樣本越大和 CLT 意味著非正態性最不重要。因此,對於小樣本量,正態性假設很重要,但測試毫無意義,對於大樣本量,測試可能更準確,但精確正態性問題變得毫無意義。

因此,綜合以上所有內容,比檢驗精確正態性更重要的是了解數據背後的科學,看看人口是否足夠接近正常。像 qqplots 這樣的圖表可以很好地診斷,但也需要了解科學。如果擔心異常值的偏度或可能性太大,則可以使用不需要正態性假設的非參數方法。

引用自:https://stats.stackexchange.com/questions/12053

comments powered by Disqus