Logistic
Logistic 回歸 - 誤差項及其分佈
關於邏輯回歸(及其假設分佈)中是否存在誤差項,我在各個地方讀到:
- 不存在錯誤項
- 誤差項具有二項分佈(根據響應變量的分佈)
- 誤差項具有邏輯分佈
有人可以澄清一下嗎?
在線性回歸中,假設觀測遵循高斯分佈,其平均參數取決於預測值。如果你從觀察中減去平均值,你會得到錯誤:平均值為零的高斯分佈,並且與預測值無關——即任何一組預測值的誤差都遵循相同的分佈。
在邏輯回歸觀察中假設遵循伯努利分佈†,其平均參數(概率)取決於預測變量值。所以對於任何給定的預測值確定一個平均值只有兩個可能的錯誤:有可能發生, &有可能發生. 對於其他預測值,錯誤將是有可能發生, &有可能發生. 所以沒有獨立於預測值的常見誤差分佈,這就是為什麼人們說“不存在誤差項”(1)。
“誤差項具有二項式分佈”(2)只是草率-“高斯模型具有高斯誤差,因此二項式模型具有二項式誤差”。(或者,正如@whuber 指出的那樣,它可以被理解為“觀察值與其期望值之間的差異具有由期望值轉換的二項分佈”。)
“誤差項具有邏輯分佈”(3) 源於從模型中推導邏輯回歸,在該模型中,您觀察邏輯分佈後具有錯誤的潛在變量是否超過某個閾值。所以這與上面定義的錯誤不同。(在這種情況下說 IMO 似乎很奇怪,或者沒有明確引用潛在變量。)
† 如果你有具有相同預測值的觀測值,給出相同的概率對於每個,然後是他們的總和服從概率的二項分佈和不。試驗. 考慮到因為錯誤導致相同的結論。