Self-Study

如何解釋泊松 GLM 結果中的參數估計

  • December 12, 2014
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
   Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
             Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

我想知道如何解釋上表中的每個參數估計。

我不認為您的問題標題準確地反映了您的要求。

如何解釋 GLM 中的參數的問題非常廣泛,因為 GLM 是一類非常廣泛的模型。回想一下,GLM 對響應變量進行建模 $ y $ 假設它遵循指數族的已知分佈,並且我們選擇了一個可逆函數 $ g $ 這樣 $$ \mathrm{E}\left[y,|,x\right] = g^{-1}{\left(x_0 + x_1\beta_1 + \dots + x_J\beta_J\right)} $$ 為了 $ J $ 預測變量 $ x $ . 在這個模型中,任何特定參數的解釋 $ \beta_j $ 是變化率 $ g(y) $ 關於 $ x_j $ . 定義 $ \mu \equiv \mathrm{E}{\left[y,|,x\right]} = g^{-1}{\left(x\right)} $ 和 $ \eta \equiv x \cdot \beta $ 保持符號乾淨。那麼,對於任何 $ j \in {1,\dots,J} $ , $$ \beta_j = \frac{\partial,\eta}{\partial,x_j} = \frac{\partial,g(\mu)}{\partial,x_j} \text{.} $$ 現在定義 $ \mathfrak{e}_j $ 成為一個向量 $ J-1 $ 零和一個 $ 1 $ 在裡面 $ j $ th 位置,例如,如果 $ J=5 $ 然後 $ \mathfrak{e}_3 = \left(0,0,1,0,0\right) $ . 然後 $$ \beta_j = g{\left(\mathrm{E}{\left[y,|,x + \mathfrak{e}_j \right]}\right)} - g{\left(\mathrm{E}{\left[y,|,x\right]}\right)} $$

這只是意味著 $ \beta_j $ 是影響 $ \eta $ 增加一個單位 $ x_j $ .

你也可以這樣陳述關係: $$ \frac{\operatorname{\partial}\mathrm{E}{\left[y,|,x\right]}}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}\mu}{\operatorname{d}\eta}\frac{\operatorname{\partial}\eta}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mu}{\operatorname{\partial}\eta} \beta_j = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j $$ 和 $$ \mathrm{E}{\left[y,|,x + \mathfrak{e}_j \right]} - \mathrm{E}{\left[y,|,x\right]} \equiv \operatorname{\Delta_j} \hat y = g^{-1}{\left( \left(x + \mathfrak{e}_j\right)\beta \right)} - g^{-1}{\left( x,\beta \right)} $$

在不知道任何事情的情況下 $ g $ ,這是我們所能得到的。 $ \beta_j $ 是影響 $ \eta $ ,關於轉換後的條件均值 $ y $ , 增加一個單位 $ x_j $ ,以及對條件均值的影響 $ y $ 增加一個單位 $ x_j $ 是 $ g^{-1}{\left(\beta\right)} $ .


但是您似乎是在使用 R 的默認鏈接函數專門詢問泊松回歸,在這種情況下是自然對數。如果是這種情況,您是在詢問一種特定類型的 GLM,其中 $ y \sim \mathrm{Poisson}{\left(\lambda\right)} $ 和 $ g = \ln $ . 然後我們可以得到一些關於特定解釋的牽引力。

從我上面說的,我們知道 $ \frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{d}g^{-1}}{\operatorname{d}\eta} \beta_j $ . 既然我們知道 $ g(\mu) = \ln(\mu) $ ,我們也知道 $ g^{-1}(\eta) = e^\eta $ . 我們也碰巧知道 $ \frac{\operatorname{d}e^\eta}{\operatorname{d}\eta} = e^\eta $ ,所以我們可以說 $$ \frac{\operatorname{\partial}\mu}{\operatorname{\partial}x_j} = \frac{\operatorname{\partial}\mathrm{E}{\left[y,|,x\right]}}{\operatorname{\partial}x_j} = e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J}\beta_j $$

這最終意味著一些有形的東西:

鑑於一個非常小的變化 $ x_j $ , 擬合的 $ \hat y $ 改變 $ \hat y,\beta_j $ .

注意:這個近似值實際上可以用於 0.2 的變化,具體取決於您需要多少精度。

使用更熟悉的單位變化解釋,我們有: $$ \begin{align} \operatorname{\Delta_j} \hat y &= e^{ x_0 + x_1\beta_1 + \dots + \left(x_j + 1\right),\beta_j + \dots + x_J\beta_J } - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J + \beta_j} - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J}e^{\beta_j} - e^{x_0 + x_1\beta_1 + \dots + x_J\beta_J} \ &= e^{ x_0 + x_1\beta_1 + \dots + x_J\beta_J} \left( e^{\beta_j} - 1 \right) \end{align} $$ 意思是

給定單位變化 $ x_j $ , 擬合的 $ \hat y $ 改變 $ \hat y \left( e^{\beta_j} - 1 \right) $ .

這裡需要注意三個重要部分:

  1. 預測變量變化的影響取決於響應的水平。
  2. 預測變量的加性變化對響應具有乘法效應。
  3. 您不能僅通過閱讀係數來解釋它們(除非您可以在頭腦中計算任意指數)。

因此,在您的示例中,將 pH 值增加 1 的效果是增加 $ \ln \hat y $ 經過 $ \hat y \left( e^{0.09} - 1 \right) $ ; 也就是說,乘以 $ \hat y $ 經過 $ e^{0.09} \approx 1.09 $ . 看起來您的結果是您在某個固定時間單位(例如,一周)內觀察到的飛鏢數量。因此,如果您在 pH 值為 6.7 的情況下每週觀察 100 次飛鏢,將河流的 pH 值提高到 7.7 意味著您現在可以預期每週看到 109 次飛鏢。

引用自:https://stats.stackexchange.com/questions/128926

comments powered by Disqus