為什麼從混合效應模型中引導殘差會產生反保守的置信區間？

July 4, 2011

我通常處理在 2 個或更多條件下對多個個體進行多次測量的數據。我最近一直在玩混合效應建模來評估條件之間差異的證據，建模individual為隨機效應。為了可視化來自這種建模的預測的不確定性，我一直在使用引導程序，在引導程序的每次迭代中，個體和個體內條件內的觀察都被替換採樣，併計算出一個新的混合效應模型，從中預測獲得。這適用於假設高斯誤差的數據，但是當數據是二項式時，引導可能需要很長時間，因為每次迭代都必須計算一個相對計算密集的二項式混合效應模型。

我的一個想法是，我可以使用原始模型的殘差，然後使用這些殘差而不是 bootstrap 中的原始數據，這將允許我在 bootstrap 的每次迭代中計算高斯混合效應模型。將原始數據的二項式模型的原始預測添加到殘差的自舉預測中，原始預測的置信區間為 95%。

然而，我最近對這種方法進行了簡單的評估，對兩個條件之間沒有差異進行建模，併計算 95% 置信區間不包括零的次數比例，我發現上述基於殘差的引導程序產生了相當強的反保守間隔（它們排除零超過 5% 的時間）。此外，我隨後對這種方法的類似評估（與之前的鏈接相同）進行了編碼，以應用於最初為高斯的數據，並且它獲得了類似（儘管不是極端）的反保守 CI。知道為什麼會這樣嗎？

請記住，所有引導置信區間僅在規定的置信水平上漸近。還有許多可能的方法來選擇自舉置信區間 Efron 百分位數法、Hall 百分位數法、雙自舉法、自舉 t、傾斜自舉法、BC、BCa 等等。您還沒有告訴我們您使用哪種方法。Schenker 在 JASA 1985 上的論文表明，對於某些卡方分佈，BC 引導置信區間低於廣告的百分比。在小樣本問題中，這個問題可能很嚴重。LaBudde 和我有兩篇論文展示了在小樣本中，當從對數正態分佈估計方差時，即使是 BCa 也可能具有非常差的覆蓋率，並且在測試兩個方差的相等性時存在類似的問題。這只是一個簡單的問題。我希望混合模型的殘差也會發生同樣的事情。在 Wiley 於 2011 年出版的新書“An Introduction to Bootstrap Methods with Applications to R”中，我們在第 3.7 節中討論了這個主題並提供了參考。令人驚訝的是，當樣本量較小時，百分位數方法有時比高階準確 BCa 方法做得更好。

引用自：https://stats.stackexchange.com/questions/12602

為什麼從混合效應模型中引導殘差會產生反保守的置信區間？

相關問答

逆變換方法，理論圖與樣本不匹配

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

任意函數的蒙特卡羅模擬

估計 Euler-Mascheroni 常數 (γγgamma) 通過蒙特卡洛模擬

允許計算黃金比例的統計實驗有哪些例子？

為什麼這個線性混合模型是奇異的？