Logistic 回歸 - 誤差項及其分佈

November 20, 2014

關於邏輯回歸（及其假設分佈）中是否存在誤差項，我在各個地方讀到：

不存在錯誤項

誤差項具有二項分佈（根據響應變量的分佈）

誤差項具有邏輯分佈

有人可以澄清一下嗎？

在線性回歸中，假設觀測遵循高斯分佈，其平均參數取決於預測值。如果你從觀察中減去平均值，你會得到錯誤：平均值為零的高斯分佈，並且與預測值無關——即任何一組預測值的誤差都遵循相同的分佈。

在邏輯回歸觀察中假設遵循伯努利分佈†，其平均參數（概率）取決於預測變量值。所以對於任何給定的預測值確定一個平均值只有兩個可能的錯誤：有可能發生, &有可能發生. 對於其他預測值，錯誤將是有可能發生, &有可能發生. 所以沒有獨立於預測值的常見誤差分佈，這就是為什麼人們說“不存在誤差項”（1）。

“誤差項具有二項式分佈”（2）只是草率-“高斯模型具有高斯誤差，因此二項式模型具有二項式誤差”。（或者，正如@whuber 指出的那樣，它可以被理解為“觀察值與其期望值之間的差異具有由期望值轉換的二項分佈”。）

“誤差項具有邏輯分佈”(3) 源於從模型中推導邏輯回歸，在該模型中，您觀察邏輯分佈後具有錯誤的潛在變量是否超過某個閾值。所以這與上面定義的錯誤不同。（在這種情況下說 IMO 似乎很奇怪，或者沒有明確引用潛在變量。）

† 如果你有具有相同預測值的觀測值，給出相同的概率對於每個，然後是他們的總和服從概率的二項分佈和不。試驗. 考慮到因為錯誤導致相同的結論。

引用自：https://stats.stackexchange.com/questions/124818

comments powered by Disqus

Logistic 回歸 - 誤差項及其分佈

相關問答

二項式-二項式是二項式嗎？

難以使用迭代對數定律

6 名 Corona 陽性 (COVID-19) 女性的母乳不含病毒——我們可以對此發表信心聲明嗎？

用二項式數據解釋廣義線性混合模型

維基百科關於二項式比例的 Clopper-Pearson 區間的文本

根據子序列出現的頻率檢查硬幣是否公平