哪個偽𝑅2R2R^2度量是要報告邏輯回歸（Cox & Snell 或 Nagelkerke）的方法嗎？

October 13, 2010

我有SPSS邏輯回歸模型的輸出。輸出報告模型擬合的兩個度量，Cox & Snell和Nagelkerke。

所以根據經驗，這些中的哪一個您會報告模型擬合的措施嗎？

或者，這些適合指數中的哪一個是期刊中通常報導的？

一些背景：回歸試圖從一些環境變量（例如，陡度、植被覆蓋……）中預測鳥類（capercaillie）的存在或不存在。不幸的是，這隻鳥並不經常出現（35 次命中到 468 次未命中），因此回歸的表現相當差。Cox & Snell 為 0.09，Nagelkerke 為 0.23。

主題是環境科學或生態學。

通常我不會報告一點也不。Hosmer 和 Lemeshow 在他們的教科書Applied Logistic Regression（第 2 版）中解釋了原因：

一般來說， [測量]基於擬合模型的預測值與[基本模型]、無數據或僅截距模型的預測值的各種比較，因此不評估擬合優度。我們認為，真正的擬合度量是嚴格基於擬合模型的觀察值與預測值的比較。

[在第 164.]

關於各種 ML 版本，“偽” stat，他們提到它不是“推薦用於日常使用，因為它不是直觀容易解釋”，但他們覺得有必要描述它，因為各種軟件包都報告了它。

他們通過寫作結束這次討論，

…低的邏輯回歸中的值是常態，當向習慣於看到線性回歸值的受眾報告它們的值時，這會帶來一個問題。…因此[通過引用文本中的運行示例進行爭論]我們不建議常規發布值與擬合邏輯模型的結果。但是，它們可能有助於在模型構建狀態下作為評估競爭模型的統計數據。

[在第 167.]

我對一些大型邏輯模型（10 萬到 30 萬條記錄，100 - 300 個解釋變量）的經驗與 H & L 描述的完全一樣。我可以達到比較高的用我的數據，最高約 0.40。這些對應於 3% 和 15% 之間的分類錯誤率（假陰性和假陽性，平衡，使用 50% 保留數據集確認）。正如 H & L 暗示的那樣，我不得不花很多時間來說服客戶（他本人是一位老練的顧問，他熟悉）關於並讓他專注於分析中的重要內容（分類錯誤率）。我可以熱情地建議您描述您的分析結果，而無需參考，這更容易誤導。

引用自：https://stats.stackexchange.com/questions/3559

comments powered by Disqus

哪個偽𝑅2R2R^2度量是要報告邏輯回歸（Cox & Snell 或 Nagelkerke）的方法嗎？

相關問答

說一個“估計”或“測量”r平方是否正確？

基於診斷指標（𝑅2R2R^2/ AUC/ 準確度/ RMSE 等）值？

R平方真的是非線性模型的無效指標嗎？

為什麼 R Squared 不是使用 LASSO 擬合回歸的好方法？

應該R2R2R^2是根據訓練數據還是測試數據計算？

能R2R2R^2大於 1？