為什麼從混合效應模型中引導殘差會產生反保守的置信區間?
我通常處理在 2 個或更多條件下對多個個體進行多次測量的數據。我最近一直在玩混合效應建模來評估條件之間差異的證據,建模
individual
為隨機效應。為了可視化來自這種建模的預測的不確定性,我一直在使用引導程序,在引導程序的每次迭代中,個體和個體內條件內的觀察都被替換採樣,併計算出一個新的混合效應模型,從中預測獲得。這適用於假設高斯誤差的數據,但是當數據是二項式時,引導可能需要很長時間,因為每次迭代都必須計算一個相對計算密集的二項式混合效應模型。我的一個想法是,我可以使用原始模型的殘差,然後使用這些殘差而不是 bootstrap 中的原始數據,這將允許我在 bootstrap 的每次迭代中計算高斯混合效應模型。將原始數據的二項式模型的原始預測添加到殘差的自舉預測中,原始預測的置信區間為 95%。
然而,我最近對這種方法進行了簡單的評估,對兩個條件之間沒有差異進行建模,併計算 95% 置信區間不包括零的次數比例,我發現上述基於殘差的引導程序產生了相當強的反保守間隔(它們排除零超過 5% 的時間)。此外,我隨後對這種方法的類似評估(與之前的鏈接相同)進行了編碼,以應用於最初為高斯的數據,並且它獲得了類似(儘管不是極端)的反保守 CI。知道為什麼會這樣嗎?
請記住,所有引導置信區間僅在規定的置信水平上漸近。還有許多可能的方法來選擇自舉置信區間 Efron 百分位數法、Hall 百分位數法、雙自舉法、自舉 t、傾斜自舉法、BC、BCa 等等。您還沒有告訴我們您使用哪種方法。Schenker 在 JASA 1985 上的論文表明,對於某些卡方分佈,BC 引導置信區間低於廣告的百分比。在小樣本問題中,這個問題可能很嚴重。LaBudde 和我有兩篇論文展示了在小樣本中,當從對數正態分佈估計方差時,即使是 BCa 也可能具有非常差的覆蓋率,並且在測試兩個方差的相等性時存在類似的問題。這只是一個簡單的問題。我希望混合模型的殘差也會發生同樣的事情。在 Wiley 於 2011 年出版的新書“An Introduction to Bootstrap Methods with Applications to R”中,我們在第 3.7 節中討論了這個主題並提供了參考。令人驚訝的是,當樣本量較小時,百分位數方法有時比高階準確 BCa 方法做得更好。