Experiment-Design

在實驗中使用控制變量?

  • January 24, 2014

在隨機分配到治療組的情況下,為什麼要控制任意數量的基線協變量?

我的理解是,隨機分配治療應該使治療變量嚴格外生,創建一個可以適當地被視為反事實的對照組。我能想到的唯一例外是當樣本量很小時,隨機分配仍然會產生不平衡的組。

任何想法都非常感謝。謝謝!

從頻率論者的角度來看,基於排列分佈的*未經調整的比較總是可以在(適當的)隨機研究之後得到證明。*可以根據常見的參數分佈(例如,分銷或分佈),因為它們與排列分佈相似。事實上,調整協變量——當它們是基於事後分析選擇時——實際上有誇大第一類錯誤的風險。請注意,這種證明與觀察樣本的平衡程度或樣本的大小無關(除了對於小樣本,排列分佈將更加離散,並且由或者分佈)。

也就是說,許多人都知道調整協變量可以提高線性模型的精度。具體而言,當協變量可預測結果且與治療變量不相關時(如在隨機研究的情況下確實如此),對協變量進行調整可提高估計治療效果的精確度。然而,鮮為人知的是,這不會自動延續到非線性模型。例如,Robinson 和 Jewell [1] 表明,在邏輯回歸的情況下,控制協變量會降低估計治療效果的精度,即使它們可以預測結果。然而,因為在調整後的模型中估計的治療效果也更大,控制預測結果的協變量確實在隨機研究後檢驗無治療效果的零假設時提高效率。

[1] LD 羅賓遜和 NP 朱厄爾。關於邏輯回歸模型中協變量調整的一些令人驚訝的結果。國際統計評論,58(2):227-40,1991。

引用自:https://stats.stackexchange.com/questions/83277

comments powered by Disqus