Confidence-Interval
如何跨多重插補數據集匯集自舉 p 值?
我擔心我想引導 p 值以估計來自多重插補 (MI) 數據,但我不清楚如何組合 MI 集的 p 值。
對於 MI 數據集,獲得估計總方差的標準方法使用魯賓規則。請參閱此處查看匯集 MI 數據集的評論。總方差的平方根用作標準誤差估計. 但是,對於某些估計器,總方差沒有已知的封閉形式,或者抽樣分佈不正常。統計數據那麼可能不是 t 分佈的,甚至不是漸近分佈的。
因此,在完整數據情況下,一種替代選擇是引導統計量以找到方差、p 值和置信區間,即使採樣分佈不正常且其封閉形式未知。在 MI 情況下,有兩種選擇:
- 跨 MI 數據集匯集自舉方差
- 跨 MI 數據集匯集 p 值或置信界限
第一個選項將再次使用魯賓規則。但是,我認為這是有問題的,如果具有非正態抽樣分佈。在這種情況下(或更一般地說,在所有情況下),可以直接使用自舉 p 值。但是,在 MI 情況下,這將導致多個 p 值或置信區間,需要跨 MI 數據集進行匯總。
所以我的問題是:我應該如何在多重插補數據集中匯集多個自舉 p 值(或置信區間)?
我歡迎任何關於如何進行的建議,謝謝。
我認為這兩種選擇都會導致正確的答案。一般來說,我更喜歡方法 1,因為它保留了整個分佈。
對於方法1,引導參數每個內的時間MI 解決方案。然後簡單地混合引導分佈以獲得您的最終密度,現在包括包含插補間變異的樣本。然後將其視為傳統的引導樣本以獲得置信區間。對小樣本使用貝葉斯引導程序。我知道沒有任何模擬工作可以研究這個過程,這實際上是一個有待研究的開放問題。
對於方法 2,使用 Licht-Rubin 程序。請參閱如何在多個估算數據集中完成的測試中獲得合併的 p 值?