Regression

如何決定使用哪個 glm 系列?

  • January 14, 2016

我有魚密度數據,我試圖在幾種不同的收集技術之間進行比較,數據有很多零,直方圖看起來很適合泊松分佈,除了作為密度,它不是整數數據。我對 GLM 比較陌生,過去幾天一直在網上尋找如何判斷要使用哪個發行版,但完全沒有找到任何有助於做出這個決定的資源。數據的示例直方圖如下所示:樣本直方圖

我不知道如何去決定合適的家庭用於 GLM。如果有人有任何建議或可以給我一個我應該檢查的資源,那就太好了。

GLM 系列包括鏈接函數以及均值-方差關係。對於泊松 GLM,鏈接函數是對數,均值-方差關係是恆等式。儘管大多數統計軟件都會向您發出警告,但在連續數據中建模一個關係是完全合理的,其中兩個變量之間的關係在對數尺度上是線性的,並且方差根據平均值增加。

這本質上是在 GLM 中選擇鏈接和方差函數的基本原理。當然,這個過程背後有幾個假設。?quasipoisson您可以通過使用擬似然(請參閱)或穩健的標準誤差(請參閱包sandwich或)來製作更穩健的模型gee

您已正確注意到數據中的許多密度為 0。在泊松概率模型下,偶爾在數據中採樣 0 是合適的,因此這些觀察不一定會導致您對比率的估計出現偏差。

要檢查 GLM 背後的假設,查看 Pearson 殘差通常會有所幫助。這些說明了平均方差關係,並向統計學家展示了特定的觀測值(例如這些 0)是否嚴重影響了估計和結果。

引用自:https://stats.stackexchange.com/questions/190763

comments powered by Disqus