Regression
規範鏈接函數有哪些有用的屬性?
所以在這裡我正在研究廣義線性模型。我知道這個問題非常幼稚和簡單,但我不完全知道為什麼鏈接規範函數如此有用。有人可以給我一個關於這個問題的直覺嗎?
我知道這個問題非常幼稚和簡單,但我不知道為什麼鏈接規範函數如此有用
真的那麼好用嗎?規範的鏈接函數主要是數學屬性。它在一定程度上簡化了數學,但在建模中,無論如何您都應該使用具有科學意義的鏈接函數。
那麼規範鏈接函數有哪些額外的屬性呢?
- 它導致存在足夠的統計數據。這可能意味著更有效的估計,但現代軟件(例如
glm
在 R 中)似乎並沒有將規範鏈接與其他鏈接區別對待。- 它簡化了一些公式,因此簡化了理論發展。許多不錯的數學屬性,請參閱GLM 的“鏈接函數”和“規範鏈接函數”之間的區別是什麼。
所以優勢似乎主要是數學和算法,而不是真正的統計。
更多細節:讓 $ Y_1, \dotsc, Y_n $ 從指數色散族模型中獨立觀察 $$ f_Y(y;\theta,\phi)=\exp\left{(y\theta-b(\theta))/a(\phi) + c(y,\phi)\right} $$滿懷期待 $ \DeclareMathOperator{\E}{\mathbb{E}} \E Y_i=\mu_i $ 和線性預測器 $ \eta_i = x_i^T \beta $ 帶有協變量向量 $ x_i $ . 鏈接函數是規範的,如果 $ \eta_i=\theta_i $ . 在這種情況下,似然函數可以寫成 $$ \mathcal{L}(\beta; \phi)=\exp\left{ \sum_i \frac{y_i x_i^T \beta -b(x_i^T \beta)}{a(\phi)}+\sum_i c(y_i,\phi)\right} $$通過分解定理,我們可以得出結論 $ \sum_i x_i y_i $ 足以 $ \beta $ .
無需贅述,將簡化IRLS所需的方程。同樣,這個谷歌搜索似乎主要是找到在簡化的上下文中提到的規範鏈接,而不是更多的統計原因。