Statistical-Significance

是否有測試來確定 GLM 過度分散是否顯著?

  • August 5, 2013

我正在 R 中創建 Poisson GLM。為了檢查過度分散,我正在查看由summary(model.name).

是否存在將該比率視為“顯著”的臨界值或測試?我知道如果它 > 1 則數據過度分散,但如果我的比率相對接近 1 [例如,一個比率為 1.7(殘餘偏差 = 25.48,df = 15),另一個比率為 1.3(rd = 324,df = 253)],我還應該切換到準泊松/負二項式嗎?我在這裡發現了這個顯著性檢驗:1-pchisq(residual deviance,df),但我只見過一次,這讓我很緊張。我還讀到(我找不到來源)比率 < 1.5 通常是安全的。意見?

在 R 包 AER 中,您將找到函數dispersiontest,它實現了Cameron & Trivedi (1990)的過度分散測試。

它遵循一個簡單的想法:在泊松模型中,均值是方差是也是。他們是平等的。該測試只是將這個假設作為零假設與替代方案進行測試,其中其中常數表示分散不足和表示過度分散。功能是一些單調函數(通常是線性的或二次的;前者是默認的)。得到的測試等價於測試對比並且使用的檢驗統計量是在 null 下漸近標準正態的統計量。

例子:

R> library(AER)
R> data(RecreationDemand)
R> rd <- glm(trips ~ ., data = RecreationDemand, family = poisson)
R> dispersiontest(rd,trafo=1)

Overdispersion test

data:  rd
z = 2.4116, p-value = 0.007941
alternative hypothesis: true dispersion is greater than 0
sample estimates:
dispersion 
   5.5658 

在這裡,我們清楚地看到存在過度分散的證據(c 估計為 5.57),這強烈反對等分散的假設(即 c=0)。

注意,如果你不使用trafo=1,它實際上會做一個測試對比和除了測試統計數據被移動一個之外,它當然與另一個測試具有相同的結果。然而,這樣做的原因是後者對應於準泊松模型中的公共參數化。

引用自:https://stats.stackexchange.com/questions/66586

comments powered by Disqus