Missing-Data
區分隨機缺失 (MAR) 和完全隨機缺失 (MCAR)
這兩個我已經解釋過很多次了。他們繼續煮我的大腦。Missing Not at Random 是有道理的,而 Missing Complete at Random 是有道理的……它是 Missing at Random 沒有那麼多。
是什麼產生了 MAR 而不是 MCAR 的數據?
隨機缺失 (MAR) 意味著缺失可以通過您擁有完整信息的變量來解釋。這不是一個可檢驗的假設,但在某些情況下它是合理的還是不合理的。
例如,進行政治民意調查。許多人拒絕回答。如果您假設人們拒絕回答的原因完全基於人口統計數據,並且如果您對每個人都有這些人口統計數據,那麼數據就是 MAR。眾所周知,人們拒絕回答的一些原因可能是基於人口統計數據(例如,低收入和高收入的人回答的可能性低於中等收入的人),但真的沒有辦法知道這是否是完整的解釋。
所以,問題變成了“它夠滿嗎?”。通常,只要數據不是隨機丟失,多重插補等方法比其他方法效果更好。