Regression

GLM:驗證分配和鏈接功能的選擇

  • March 10, 2015

我有一個採用高斯分佈和對數鏈接函數的廣義線性模型。擬合模型後,我檢查殘差:QQ 圖、殘差與預測值、殘差直方圖(承認需要謹慎)。一切看起來都很好。這似乎表明(對我而言)高斯分佈的選擇是非常合理的。或者,至少,殘差與我在模型中使用的分佈一致。

Q1 : 說它驗證了我的發行選擇是否太過分了?

我選擇了一個日誌鏈接函數,因為我的響應變量總是積極的,但我想要某種確認它是一個不錯的選擇。

Q2:是否有任何測試,例如檢查分佈選擇的殘差,可以支持我選擇鏈接功能?(選擇鏈接功能對我來說似乎有點武斷,因為我能找到的唯一指導方針非常模糊和手搖,大概是有充分理由的。)

  1. 這是關於您是否可以斷言零假設的常見問題的變體。在您的情況下,空值將是殘差是高斯的,並且您的圖(qq 圖、直方圖等)的目視檢查構成了“測試”。(對於斷言空值問題的一般概述,在這裡閱讀我的答案可能會有所幫助:為什麼統計學家說不顯著的結果意味著“你不能拒絕空值”而不是接受原假設?)在您的具體情況下,您可以說這些圖顯示您的殘差與您對正態性的假設一致,但它們並沒有“驗證”該假設。
  2. 您可以使用不同的鏈接函數擬合您的模型並進行比較,但是沒有單獨測試單個鏈接函數(這顯然是不正確的,請參閱@Glen_b 的答案)。在我對 logit 和 probit 模型之間的差異的回答中(可能值得一讀,儘管它並不完全相同),我認為應該根據以下條件選擇鏈接函數:

1. 響應分佈的知識, 2. 理論考慮,以及 3. 對數據的經驗擬合。

在該框架內,高斯模型的規範鏈接將是恆等鏈接。在這種情況下,您拒絕了這種可能性,大概是出於理論上的原因。我懷疑你的想法是不能取負值(請注意,“沒有發生”不是一回事)。如果是這樣,日誌是一個合理的先驗選擇,但它不僅可以防止從變成負數,它還對曲線關係產生了特定的形狀。殘差與擬合值的標準圖(可能覆蓋了黃土擬合)將幫助您確定數據中的內在曲率是否與對數鏈接施加的特定曲率合理匹配。正如我所提到的,您還可以嘗試滿足您想要的理論標準的任何其他轉換,並直接比較兩者的擬合度。

引用自:https://stats.stackexchange.com/questions/141181

comments powered by Disqus