高級回歸建模示例
我正在尋找一個高級線性回歸案例研究,說明使用 GLM 或 OLS 對複雜的多重非線性關係進行建模所需的步驟。很難找到超出基本學校示例的資源:我讀過的大多數書籍不會比響應的對數轉換加上一個預測變量的 BoxCox 或最好情況下的自然樣條更進一步。到目前為止,我看到的所有示例都在單獨的模型中處理每個數據轉換問題,通常在單個預測器模型中。
我知道 BoxCox 或 YeoJohnson 轉換是什麼。我正在尋找的是一個詳細的、真實的案例研究,其中的響應/關係並不明確。例如,響應並非嚴格為正(因此您不能使用 log 或 BoxCox),預測變量之間與響應之間存在非線性關係,最大似然數據轉換似乎並不意味著標準 0.33或 0.5 指數。此外,發現殘差方差是非恆定的(它從來都不是),因此也必須轉換響應,並且必須在非標準 GLM 族回歸或響應轉換之間做出選擇。研究人員可能會做出選擇以避免過度擬合數據。
編輯
到目前為止,我收集了以下資源:
- 回歸建模策略,F. Harrell
- 應用計量經濟學時間序列,W. Enders
- 使用 R、G. Petris 的動態線性模型
- 應用回歸分析,D. Kleinbaum
- 統計學習簡介,G. James/D。威騰
我只閱讀了最後一篇(ISLR),它是一篇非常好的文章(我的手錶上有 5 顆星),儘管它比高級回歸建模更面向 ML。
還有一篇關於 CV的好帖子提出了一個具有挑戰性的回歸案例。
前面已經提到過Regression Modeling Strategies和ISLR,是兩個非常好的建議。我還有其他一些你可能想要考慮的。
Kuhn and Johnson 的Applied Predictive Modeling包含許多很好的案例研究,並且非常實用。
R 實用數據科學在其應用程序的上下文中處理實用(回歸)建模主要作為業務情況下的預測模型。
Generalized Additive Models: An Introduction with R by Simon Wood 很好地處理了廣義加法模型以及如何使用他
mgcv
的 R 包來擬合它們。它確實包含一些重要的實際示例。使用 GAM 模型是找出“正確”變換的替代方法,因為這是通過樣條展開和懲罰最大似然估計以數據自適應方式完成的。然而,還需要做出其他選擇,例如鍊接功能的選擇。R的mboost包也適合 GAM 模型,但通過提升使用不同的方法。我推薦該軟件包的教程(其中一個 Vignettes)。
我還會提到Hendry 和 Doornik 的《經驗模型發現和理論評估》,儘管我自己還沒有讀過這本書。它已被推薦給我。