Logistic

哪個偽𝑅2R2R^2度量是要報告邏輯回歸(Cox & Snell 或 Nagelkerke)的方法嗎?

  • October 13, 2010

我有SPSS邏輯回歸模型的輸出。輸出報告模型擬合的兩個度量,Cox & SnellNagelkerke

所以根據經驗,這些中的哪一個您會報告模型擬合的措施嗎?

或者,這些適合指數中的哪一個是期刊中通常報導的?


一些背景:回歸試圖從一些環境變量(例如,陡度、植被覆蓋……)中預測鳥類(capercaillie)的存在或不存在。不幸的是,這隻鳥並不經常出現(35 次命中到 468 次未命中),因此回歸的表現相當差。Cox & Snell 為 0.09,Nagelkerke 為 0.23。

主題是環境科學或生態學。

通常我不會報告一點也不。Hosmer 和 Lemeshow 在他們的教科書Applied Logistic Regression(第 2 版)中解釋了原因:

一般來說, [測量]基於擬合模型的預測值與[基本模型]、無數據或僅截距模型的預測值的各種比較,因此不評估擬合優度。我們認為,真正的擬合度量是嚴格基於擬合模型的觀察值與預測值的比較。

[在第 164.]

關於各種 ML 版本,“偽” stat,他們提到它不是“推薦用於日常使用,因為它不是直觀容易解釋”,但他們覺得有必要描述它,因為各種軟件包都報告了它。

他們通過寫作結束這次討論,

…低的邏輯回歸中的值是常態,當向習慣於看到線性回歸值的受眾報告它們的值時,這會帶來一個問題。…因此[通過引用文本中的運行示例進行爭論]我們不建議常規發布值與擬合邏輯模型的結果。但是,它們可能有助於在模型構建狀態下作為評估競爭模型的統計數據。

[在第 167.]

我對一些大型邏輯模型(10 萬到 30 萬條記錄,100 - 300 個解釋變量)的經驗與 H & L 描述的完全一樣。我可以達到比較高的用我的數據,最高約 0.40。這些對應於 3% 和 15% 之間的分類錯誤率(假陰性和假陽性,平衡,使用 50% 保留數據集確認)。正如 H & L 暗示的那樣,我不得不花很多時間來說服客戶(他本人是一位老練的顧問,他熟悉) 關於並讓他專注於分析中的重要內容(分類錯誤率)。我可以熱情地建議您描述您的分析結果,而無需參考,這更容易誤導。

引用自:https://stats.stackexchange.com/questions/3559

comments powered by Disqus