Logistic

多項邏輯回歸與一對一二元邏輯回歸

  • March 13, 2013

假設我們有一個因變量有幾個類別和一組自變量。

多項式邏輯回歸相對於二元邏輯回歸集(即one-vs-rest 方案)有哪些優勢?通過一組二元邏輯回歸,我的意思是對於每個類別我們建立單獨的二元邏輯回歸模型,目標=1,當否則為 0。

如果 $ Y $ 有兩個以上的類別,如果您旨在比較模型的參數,您關於一個回歸相對於另一個回歸的“優勢”的問題可能毫無意義,因為模型將根本不同:

$ \bf log \frac{P(i)}{P(not~i)}=logit_i=linear~combination $ 對於每個 $ i $ 二元邏輯回歸,和

$ \bf log \frac{P(i)}{P(r)}=logit_i=linear~combination $ 對於每個 $ i $ 多元邏輯回歸中的類別, $ r $ 是選擇的參考類別( $ i \ne r $ ).

但是,如果您的目標只是預測每個類別的概率 $ i $ 任何一種方法都是合理的,儘管它們可能會給出不同的概率估計。估計概率的公式是通用的:

$ \bf P'(i)= \frac{exp(logit_i)}{exp(logit_i)+exp(logit_j)+\dots+exp(logit_r)} $ , 在哪裡 $ i,j,\dots,r $ 是所有類別,如果 $ r $ 被選為參考之一 $ \bf exp(logit)=1 $ . 因此,對於二元邏輯,相同的公式變為 $ \bf P'(i)= \frac{exp(logit_i)}{exp(logit_i)+1} $ . 多項邏輯依賴於(並不總是現實的)不相關備選方案獨立性的假設,而一系列二元邏輯預測則不然。


一個單獨的主題是多項式和二元邏輯回歸之間的技術差異,以防萬一 $ Y $ 是二分法的。結果會有什麼不同嗎?大多數情況下,在沒有協變量的情況下,結果是相同的,但算法和輸出選項仍然存在差異。讓我在 SPSS 中引用關於該問題的 SPSS Help:

二元邏輯回歸模型可以使用邏輯回歸過程或多項邏輯回歸過程進行擬合。每個程序都有其他程序沒有的選項。一個重要的理論區別是邏輯回歸過程使用個案級別的數據生成所有預測、殘差、影響統計和擬合優度檢驗,而不管數據如何輸入以及協變量模式的數量是否小於案例總數,而多項 Logistic 回歸過程在內部聚合案例以形成具有相同協變量模式的預測變量的亞群,基於這些亞群產生預測、殘差和擬合優度檢驗。

邏輯回歸提供以下獨特功能:

  • Hosmer-Lemeshow 模型擬合優度檢驗
  • 逐步分析
  • 對比定義模型參數化
  • 分類的替代切點
  • 分類圖
  • 模型安裝在一組案例到一組外置案例
  • 保存預測、殘差和影響統計

多項 Logistic回歸提供以下獨特功能:

  • 模型擬合優度的 Pearson 和偏差卡方檢驗
  • 用於擬合優度檢驗的數據分組的亞群規範
  • 按亞群列出計數、預測計數和殘差
  • 修正過度分散的方差估計
  • 參數估計的協方差矩陣
  • 參數的線性組合測試
  • 嵌套模型的顯式規範
  • 使用差異變量擬合 1-1 匹配的條件邏輯回歸模型

引用自:https://stats.stackexchange.com/questions/52104

comments powered by Disqus