Regression
對數線性回歸與邏輯回歸
誰能提供對數線性回歸和邏輯回歸之間差異的清晰列表?我知道前者是一個簡單的線性回歸模型,但我不清楚何時應該使用每個模型。
這個名字有點用詞不當。對數線性模型傳統上用於以列聯表格式分析數據。雖然“計數數據”不一定遵循泊松分佈,但對數線性模型實際上只是泊松回歸模型。因此“log”名稱(泊松回歸模型包含“log”鏈接函數)。
線性回歸模型中的“對數轉換結果變量”不是對數線性模型(也不是指數結果變量,正如“對數線性”所暗示的那樣)。對數線性模型和邏輯回歸都是廣義線性模型的示例,其中線性預測變量(例如對數賠率或對數率)之間的關係在模型變量中是線性的。它們不是“簡單的線性回歸模型”(或使用通常的模型格式)。
儘管如此,使用邏輯回歸和泊松回歸可以獲得對分類變量之間關聯的等效推斷。只是在泊松模型中,結果變量被視為協變量。有趣的是,您可以建立一些模型,以與比例賠率模型非常相似的方式跨組借用信息,但這種方式並沒有得到很好的理解,也很少使用。
使用 R 在邏輯和泊松回歸模型中獲得等效推理的示例如下所示:
y <- c(0, 1, 0, 1) x <- c(0, 0, 1, 1) w <- c(10, 20, 30, 40) ## odds ratio for relationship between x and y from logistic regression glm(y ~ x, family=binomial, weights=w) ## the odds ratio is the same interaction parameter between contingency table frequencies glm(w ~ y * x, family=poisson)
有趣,之間缺乏關聯和表示邏輯回歸模型中的優勢比為 1,同樣,對數線性模型中的交互項為 0。讓您了解我們如何衡量列聯表數據中的條件獨立性。