Dataset
受治療影響的協變量需要良好的數據示例
我查看了很多 R 數據集、DASL 和其他地方的帖子,並沒有找到很多有趣的數據集的好例子來說明實驗數據的協方差分析。統計教科書中有許多帶有人為數據的“玩具”數據集。
我想舉一個例子:
- 數據真實,故事有趣
- 至少有一個處理因素和兩個協變量
- 至少一個協變量受一種或多種治療因素影響,一個不受治療影響。
- 實驗而不是觀察,最好
背景
我真正的目標是為我的 R 包找到一個很好的例子。但更大的目標是人們需要看到好的例子來說明協方差分析中的一些重要問題。考慮以下虛構的場景(請理解,我對農業的了解充其量只是膚淺的)。
- 我們做了一個實驗,將肥料隨機分配到地塊上,然後種植作物。在合適的生長期後,我們收穫作物並測量一些質量特徵——即響應變量。但我們還記錄了生長期間的總降雨量,以及收穫時的土壤酸度——當然,還有使用了哪種肥料。因此,我們有兩個協變量和一個處理。
分析結果數據的常用方法是擬合線性模型,將處理作為一個因素,並為協變量添加加性效應。然後總結結果,計算“調整均值”(AKA 最小二乘均值),這是模型在平均降雨量和平均土壤酸度下對每種肥料的預測。這使一切都處於平等地位,因為當我們比較這些結果時,我們保持降雨和酸度不變。
但這可能是錯誤的做法——因為肥料可能會影響土壤酸度以及反應。這使得調整後的方法具有誤導性,因為處理效果包括其對酸度的影響。處理這個問題的一種方法是將酸度從模型中剔除,然後降雨調整的方法將提供一個公平的比較。但如果酸度很重要,那麼這種公平性就會付出巨大的代價,即殘差的增加。
有一些方法可以通過在模型中使用調整後的酸度版本而不是其原始值來解決此問題。即將對我的 R 包lsmeans進行的更新將使這一切變得非常容易。但我想有一個很好的例子來說明它。我將非常感謝並正式承認任何可以向我指出一些很好的說明性數據集的人。
您可能想查看
mediation
R 包。它確實包括實驗數據jobs
,如framing
治療變量影響響應變量和協變量(即治療效果的中介)以及不受治療影響的協變量。我查看了中介文獻,因為我雖然您準確地描述了一項中介研究:肥料對作物質量的影響是通過其對土壤酸度的影響來介導的。即使
mediation
包中的數據集不能讓您滿意,如果您查看中介文獻,您可能會找到一個。