GLM 的“鏈接函數”和“規範鏈接函數”有什麼區別
術語“鏈接功能”和“規範鏈接功能”有什麼區別?此外,使用其中一種是否有任何(理論上的)優勢?
例如,可以使用許多鏈接函數(例如logit、probit等)對二元響應變量進行建模。但是,這裡的logit被認為是“規範”鏈接函數。
上面的答案比較直觀,所以我嘗試更加嚴謹。
什麼是 GLM?
讓 $ Y=(y,\mathbf{x}) $ 表示一組響應 $ y $ 和 $ p $ 維協變量向量 $ \mathbf{x}=(x_1,\dots,x_p) $ 有期望值 $ E(y)=\mu $ . 為了 $ i=1,\dots,n $ 獨立觀察,每個的分佈 $ y_i $ 是一個具有密度的指數族 $$ f(y_i;\theta_i,\phi)=\exp\left(\frac{y_i\theta_i-\gamma(\theta_i)}{\phi}+\tau(y_i,\phi)\right) = \alpha(y_i, \phi)\exp\left(\frac{y_i\theta_i-\gamma(\theta_i)}{\phi}\right) $$ 這裡,感興趣的參數(自然或規範參數)是 $ \theta_i $ , $ \phi $ 是一個比例參數(已知或被視為令人討厭的)和 $ \gamma $ 和 $ \tau $ 是已知函數。這 $ n $ 的固定輸入值的維向量 $ p $ 解釋變量表示為 $ \mathbf{x}1,\dots,\mathbf{x}p $ . 我們假設輸入向量僅通過線性函數(線性預測器)影響(1), $$ \eta_i=\beta_0+\beta_1x{i1}+\dots+\beta_px{ip} $$ 在其上 $ \theta_i $ 依靠。可以證明 $ \theta=(\gamma')^{-1}(\mu) $ , 這種依賴關係是通過連接線性預測器建立的 $ \eta $ 和 $ \theta $ 通過平均值。更具體地說,均值 $ \mu $ 被視為線性預測器的可逆和平滑函數,即 $$ g(\mu)=\eta\ \textrm{or}\ \mu=g^{-1}(\eta) $$ 現在回答你的問題:
功能 $ g(\cdot) $ 稱為鏈接函數。如果函數連接 $ \mu $ , $ \eta $ 和 $ \theta $ 這樣 $ \eta \equiv\theta $ ,則此鏈接稱為規範鏈接,其形式為 $ g=(\gamma')^{-1} $ .
而已。然後,使用規範鏈接有許多理想的統計特性,例如,充分的統計量是 $ X’y $ 帶組件 $ \sum_i x_{ij} y_i $ 為了 $ j = 1, \dots, p $ ,用於尋找 ML 估計量的牛頓法和 Fisher 評分重合,這些鏈接簡化了 MLE 的推導,它們確保線性回歸的某些屬性(例如,殘差之和為 0)保持不變,或者它們確保 $ \mu $ 保持在結果變量的範圍內。
因此,它們傾向於默認使用。但是請注意,沒有先驗理由說明模型中的效果應該在此鏈接或任何其他鏈接給出的規模上相加。