Missing-Data

缺失率和多重插補

  • March 9, 2012

使用多重插補 (MI) 時,是否存在最不可接受的限制?

例如,如果變量中的缺失值是 20% 的情況,而其他變量有缺失值但沒有達到如此高的水平,我可以使用 MI 嗎?

從評論中,您確信您處於 MAR 或 MCAR 情況。那麼多重插補至少是合理的。那麼有多少缺失是可以處理的呢?這樣想:

基本上,多重插補會使您的所有模型參數估計值不太確定,因為您可以使用插補模型預測缺失數據的準確度,這取決於需要插補的缺失量以及您使用的插補數。

因此,“太多”的缺失有多少取決於您願意忍受多少增加的方差/不確定性。對您有用的數量可能是相對效率() 的 MI 分析。這取決於“缺失信息的比例”(不是簡單的缺失率),通常稱為,以及插補的數量,通常稱為, 作為.

與其在此處生成缺失信息等的定義,您可以簡單地閱讀MI 常見問題解答,它非常清楚地說明了事情。從那裡你會知道你是否想要處理原始來源:魯賓等。

實際上,您可能應該嘗試進行插補分析,看看它是如何工作的。

引用自:https://stats.stackexchange.com/questions/24392

comments powered by Disqus