Regression
為什麼我們需要多元回歸(而不是一堆單變量回歸)?
我剛剛瀏覽了這本精彩的書:Johnson 和 Wichern 的《應用多元統計分析》。具有諷刺意味的是,我仍然無法理解使用多變量(回歸)模型而不是單獨的單變量(回歸)模型的動機。我瀏覽了 stats.statexchange 帖子1和2,它們解釋了 (a) 多元回歸和多元回歸之間的差異和 (b) 多元回歸結果的解釋,但我無法從我的所有信息中調整多元統計模型的使用上網了解他們。
我的問題是:
- 為什麼我們需要多元回歸?為了得出推論,同時考慮結果而不是單獨考慮結果有什麼好處。
- 何時使用多變量模型以及何時使用多個單變量模型(針對多個結果)。
- 以UCLA 網站中給出的示例為例,它具有三個結果:控制點、自我概念和動機。關於 1. 和 2.,當我們做三個單變量多元回歸和一個多元多元回歸時,我們可以比較分析嗎?如何證明一個優於另一個?
- 我沒有遇到過很多利用多元統計模型的學術論文。這是因為多元正態性假設、模型擬合/解釋的複雜性還是任何其他具體原因?
您是否閱讀了您鏈接的 UCLA 網站上的完整示例?
關於 1:
使用多元模型可以幫助您(正式地、推論地)比較結果之間的係數。
在該鏈接示例中,他們使用多變量模型來測試結果與結果的
write
係數是否顯著不同。我不是心理學家,但大概問問你的寫作能力是否以同樣的方式影響/預測兩個不同的心理變量是很有趣的。(或者,如果我們不相信空值,那麼詢問您是否收集了足夠的數據以令人信服地證明效果確實不同仍然很有趣*。*) 如果您進行單獨的單變量分析,則比較難以比較locus_of_control``self_concept
write
兩個模型的係數。兩個估計都來自同一個數據集,因此它們是相關的。多元模型解釋了這種相關性。另外,關於 4:
有一些非常常用的多元模型,例如重複測量方差分析。通過適當的研究設計,假設您將幾種藥物中的每一種給予每位患者,並在每種藥物後測量每位患者的健康狀況。或者想像你隨著時間的推移測量相同的結果,就像縱向數據一樣,比如隨著時間的推移兒童的身高。然後,每個單元都有多個結果(即使它們只是“相同”測量類型的重複)。您可能至少想做一些簡單的對比:比較藥物 A 與藥物 B 的效果,或藥物 A 和 B 與安慰劑的平均效果。為此,重複測量方差分析是一種適當的多變量統計模型/分析。