Hypothesis-Testing

低樣本量:LR vs F - 測試

  • October 16, 2014

你們中的一些人可能已經閱讀過這篇不錯的論文:

O’Hara RB, Kotze DJ (2010) 不要對計數數據進行對數轉換。生態與進化方法一:118—122。點擊

目前,我正在將負二項式模型與轉換數據的高斯模型進行比較。與 O’Hara RB,Kotze DJ (2010) 不同,我正在研究低樣本量和假設檢驗環境中的特殊情況。

A 使用模擬來研究兩者之間的差異。

I 類錯誤模擬

所有計算都在 R 中完成。

我用一個對照組模擬了來自因子設計的數據() 和 5 個治療組 ()。豐度來自具有固定色散參數(θ = 3.91)的負二項式分佈。所有處理中的豐度均相等。

對於模擬,我改變了樣本大小(3、6、9、12)和豐度(2、4、8、…、1024)。使用負二項式 GLM ( MASS:::glm.nb())、擬泊松 GLM ( glm(..., family = 'quasipoisson') 和高斯 GLM + 對數轉換數據 ( lm(...)) 生成和分析了 100 個數據集。

我使用似然比檢驗 ( lmtest:::lrtest())(高斯 GLM 和 neg.bin GLM)以及 F 檢驗(高斯 GLM 和準泊松 GLM)(anova(...test = 'F'))將模型與空模型進行了比較。

如果需要,我可以提供 R 代碼,但也可以在這裡查看我的相關問題。

結果 在此處輸入圖像描述

對於小樣本量,LR 檢驗(綠色 - neg.bin.;紅色 - 高斯)導致 I 型錯誤增加。F 檢驗(藍色 - 高斯,紫色 - 準泊松)似乎甚至適用於小樣本量。

LR 測試為 LM 和 GLM 提供了相似的(增加的)I 類錯誤。

有趣的是,準泊松效果很好(但也適用於 F 檢驗)。

正如預期的那樣,如果樣本量增加,LR-Test 也表現良好(漸近正確)。

對於小樣本量,GLM 存在一些收斂問題(未顯示),但僅在低豐度時,因此可以忽略誤差源。

問題

  1. 請注意,數據是從 neg.bin 生成的。模型 - 所以我預計 GLM 表現最好。然而,在這種情況下,轉換豐度的線性模型表現更好。準泊松(F 檢驗)也是如此。我懷疑這是因為 F 檢驗在小樣本量下做得更好 - 這是正確的嗎?為什麼?
  2. 由於漸近性,LR-Test 表現不佳。有改進的可能嗎?
  3. 是否還有其他可能表現更好的 GLM 測試?如何改進 GLM 的測試?
  4. 對於樣本量較小的計數數據,應該使用什麼類型的模型?

編輯:

有趣的是,二項式 GLM 的 LR 測試確實工作得很好: 在此處輸入圖像描述

在這裡,我從二項分佈中提取數據,設置與上述類似。

紅色:高斯模型(LR-Test + arcsin 變換),Ocher:二項式 GLM(LR-Test),綠色:高斯模型(F-Test + arcsin 變換),藍色:準 GLM(F-test),紫色:非參數。

這裡只有高斯模型(LR-Test + arcsin 變換)顯示 I 類錯誤增加,而 GLM(LR-Test)在 I 類錯誤方面做得很好。因此,分佈之間似乎也存在差異(或者可能是 glm 與 glm.nb?)。

您使用的似然比檢驗使用卡方分佈來近似似然的零分佈。這種近似在大樣本量下效果最好,因此它在小樣本量下的不准確性是有道理的。

我看到一些選項可以在您的情況下獲得更好的 I 型錯誤:

  • 似然比檢驗有修正版本,例如 Bartlett 修正。我對這些了解不多(除了它們存在的事實),但我聽說 Ben Bolker 知道的更多。
  • 您可以通過自舉來估計似然比的零分佈。如果觀察到的似然比落在 bootstrap 分佈的中間 95% 之外,那麼它在統計上是顯著的。

最後,泊松分佈的自由參數比負二項式少一個,當樣本量非常小時可能值得嘗試。

引用自:https://stats.stackexchange.com/questions/120309

comments powered by Disqus