具有實際概率的邏輯回歸∈(𝑎,𝑏)∈(a,b)in(a,b)在哪裡0`<𝑎`<𝑏`<10`<a`<b`<10`<a`<b`<1

February 12, 2020

使用邏輯回歸對概率建模時，擬合概率的範圍是 . 邏輯函數漸近線和，所以這是一個很好的匹配。然而，在某些應用中，實際範圍的概率可以是和，導致尾部出現（潛在的大量）不匹配。

例如，考慮一個所有人都工作並獲得報酬的人群。付款取決於技能、努力和其他我們衡量的東西。每個人還參與抽獎，其貨幣結果正態分佈，期望值為零。個人的收入是工作收入和抽獎結果的總和。對於任何給定的常數 , 條件概率個人收入大於 , 以技巧、努力和其他東西為條件，而不是彩票的結果，將滿足 . （我相信那裡有更好的例子，但這是首先想到的。）

問題：

如何調整邏輯回歸模型和給出？（或者不需要調整？）

如何調整邏輯回歸模型和沒有給出，但我們知道 ?

或者就此而言，一個概率模型

或者就此而言，標準的普通 CDF

感興趣人群中個體的範圍

什麼時候和沒有給出，只需使用通常的邏輯模型（或任何合適的），因為（如果它使用合適的鏈接函數）保證擬合概率不小於下限並且上限不大於這些界限給出了區間估計和

有趣的問題是什麼時候和是已知的。 您正在娛樂的那種模型似乎如下。您想到了一個單參數分佈系列在哪裡對應於一些“概率”參數。例如，可能是伯努利響應時的分佈是二進制的。

對於與解釋變量向量相關的觀察響應模型然後採取形式

對於一些“反向鏈接函數” 我們必須指定：它是模型的一部分。例如，在邏輯回歸中，經常被認為是由定義的邏輯函數

無論細節如何，製作時獨立觀察（每個都與一個向量相關聯 ) 假設符合這個模型，他們的可能性是

你可以像往常一樣繼續最大化它。（豎筆僅表示它後面的參數值決定使用哪個概率函數：它不是條件概率。）

讓是相關的參數估計。的預測條件分佈因此是

當圖像包含在區間內 那麼顯然每個無論如何，也在那個區間也許。（也就是說，這個結論既適用於在數據集中並用於外推到其他 )

一個有吸引力的選擇簡單地重新調整通常的邏輯函數，

**將此視為出發點：**像往常一樣，探索性分析和擬合優度測試將幫助您確定這是否適合

供以後使用，**請注意和有一個比看起來更複雜的關係，**因為最終它們被用來確定通過他們的論點因此，這種關係的特徵在於函數取決於

有溶液（如果是可逆的，通常是這樣）

除非最初是線性的，這通常是非線性的。

**為了解決此線程中其他地方表達的問題，**讓我們比較使用獲得的解決方案和考慮最簡單的情況觀察和需要估計參數向量的標量解釋變量認為是二項式的家庭分佈，讓並想像被觀察到。寫作為了可能性是

最大化時用獨特的解決方案

現在讓我們假設和也就是說，我們假設不管什麼價值可能有。隨著縮放版本我們和以前一樣計算，只是代入為了

這不再最大化 因為這是不可能的超過按設計。被最大化的任何那會讓盡可能接近這發生在任意變大。那麼，使用受限反向鏈接函數的估計是

顯然兩者都沒有或者是原始（無限制）估計的任何簡單函數；特別是，它們與任何重新縮放無關。

**這個簡單的例子暴露了整個程序的一個危險：**當我們假設什麼和（以及關於模型的所有其他內容）與數據不一致，我們可能會得到模型參數的奇怪估計這就是我們付出的代價。

但是，如果我們的假設是正確的，或者至少是合理的呢？ 讓我們用代替這次，確實最大化似然性，由此估計滿足

所以

蘊涵

在這種情況下，不變但_ 發生了複雜的變化（不是重新縮放的版本 ).

在這些例子中，當原始估計不在區間內時必須更改在更複雜的例子中，它可能必須改變才能改變其他觀察值的估計值 這是效果之一限制。另一個影響是，即使限制改變了估計的概率，原始反向鏈接之間的非線性關係和受限鏈接 在參數估計中引起非線性（並且可能是複雜的）變化

**為了說明，**我根據這個模型創建了數據和限制和為了解釋值的等距值之間和包含，然後使用普通邏輯回歸（無約束）擬合它們一次，並使用縮放反向鏈接方法再次使用已知約束。

以下是結果二項式觀察結果（實際上反映了獨立的二進制結果）：

這已經提供了洞察力：模型（左圖）預測接近上限的概率對於小隨機變化導致某些觀測值的頻率大於在沒有任何限制的情況下，邏輯回歸（中圖）傾向於預測更高的概率。類似的現象發生在大

受限模型極大地改變了估計的斜率到為了使預測保持在發生這種情況的部分原因是它是一個小數據集。

*直觀地說，*更大的數據集應該產生更接近底層（真實）數據生成過程的結果。人們也可能期望不受限制的模型運行良好。可以？為了檢查，我創建了一個大一千倍的數據集：二項式的觀察回复。

當然，正確的模型（右面板）現在非常適合。然而，觀察到的頻率的隨機變化仍然導致普通邏輯模型超出限制。

顯然，當假定值和是（接近）正確的並且鏈接函數的形狀大致正確，最大似然效果很好 - 但它絕對不會產生與邏輯回歸相同的結果。

為了提供完整的文檔，這裡是R生成第一個圖的代碼。更改12為1200和8生成80第二個圖形。
#
# Binomial negative log likelihood.
#
logistic.ab <- function(x, a=0, b=1) {
 a + (b - a) / (1 + exp(-x))
}
predict.ab <- function(beta, x, invlink=logistic.ab) {
 invlink(cbind(1, x) %*% beta)
}
Lambda <- function(beta, n, k, x, invlink=logistic.ab, tol=1e-9) {
 p <- predict.ab(beta, x, invlink)
 p <- (1-2*tol) * p + tol                 # Prevents numerical problems
 - sum((k * log(p) + (n-k) * log(1-p)))
}
#
# Simulate data.
#
N <- 12                       # Number of binomial observations
x <- seq(0, 1, length.out=N)  # Explanatory values
n <- rep(8, length(x))        # Binomial counts per observation
beta <- c(4, -7)              # True parameter
a <- 1/10                     # Lower limit
b <- 1/2                      # Upper limit

set.seed(17)
p <- predict.ab(beta, x, function(x) logistic.ab(x, a, b))
X <- data.frame(x = x, p = p, n = n, k = rbinom(length(x), n, p))
#
# Create a data frame for plotting predicted and true values.
#
Y <- with(X, data.frame(x = seq(min(x), max(x), length.out=101)))
Y$p <-with(Y, predict.ab(beta, x, function(x) logistic.ab(x, a, b)))
#
# Plot the data.
#
par(mfrow=c(1,3))
col <- hsv(0,0,max(0, min(1, 1 - 200/N)))
with(X, plot(x, k / n, ylim=0:1, col=col, main="Data with True Curve"))
with(Y, lines(x, p))
abline(h = c(a,b), lty=3)
#
# Reference fit: ordinary logistic regression.
#
fit <- glm(cbind(k, n-k) ~ x, data=X, family=binomial(link = "logit"),
          control=list(epsilon=1e-12))
#
# Fit two models: ordinary logistic and constrained.
#
for (ab in list(c(a=0, b=1), c(a=a, b=b))) {
 #
 # MLE.
 #
 g <- function(x) logistic.ab(x, ab[1], ab[2])
 beta.hat <- c(0, 1)
 fit.logistic <- with(X, nlm(Lambda, beta.hat, n=n, k=k, x=x, invlink=g,
                             iterlim=1e3, steptol=1e-9, gradtol=1e-12))
 if (fit.logistic$code > 3) stop("Check the fit.")
 beta.hat <- fit.logistic$estimate

 # Check:
 print(rbind(Reference=coefficients(fit), Constrained=beta.hat))

 # Plot:
 Y$p.hat <- with(Y, predict.ab(beta.hat, x, invlink=g))
 with(X, plot(x, k / n, ylim=0:1,, col=col,
              main=paste0("Fit with a=", signif(ab[1], 2),
                          " and b=", signif(ab[2], 2))))
 with(Y, lines(x, p.hat, col = "Red", lwd=2))
 with(Y, lines(x, p))
 abline(h = c(a, b), lty=3)
}
par(mfrow=c(1,1))

引用自：https://stats.stackexchange.com/questions/449145

具有實際概率的邏輯回歸∈(𝑎,𝑏)∈(a,b)in(a,b)在哪裡0`<𝑎`<𝑏`<10`<a`<b`<10`<a`<b`<1

相關問答

為什麼指數族在統計學中如此重要？

可以使用多項式邏輯回歸學習任何數據嗎

如何從二元邏輯回歸模型中獲得兩個概率之間差異的置信區間？

sklearn邏輯回歸收斂到一個簡單案例的意外係數

無法在模擬數據集中獲得正確的邏輯回歸係數

為什麼當我對結果變量進行日誌轉換時，我的空模型的截距不等於平均值？我如何解釋它？

具有實際概率的邏輯回歸∈(𝑎,𝑏)∈(a,b)in(a,b)在哪裡0<𝑎<𝑏<10<a<b<10<a<b`<1

相關問答

為什麼指數族在統計學中如此重要？

可以使用多項式邏輯回歸學習任何數據嗎

如何從二元邏輯回歸模型中獲得兩個概率之間差異的置信區間？

sklearn邏輯回歸收斂到一個簡單案例的意外係數

無法在模擬數據集中獲得正確的邏輯回歸係數

為什麼當我對結果變量進行日誌轉換時，我的空模型的截距不等於平均值？我如何解釋它？

具有實際概率的邏輯回歸∈(𝑎,𝑏)∈(a,b)in(a,b)在哪裡0`<𝑎`<𝑏`<10`<a`<b`<10`<a`<b`<1