Modeling

大數據泊松回歸:改變計量單位有錯嗎?

  • July 20, 2010

由於泊松分佈中的階乘,當觀測值很大時,估計泊松模型(例如,使用最大似然)變得不切實際。因此,例如,如果我試圖估計一個模型來解釋給定年份的自殺人數(只有年度數據可用),並且說,每年有數千人自殺,那麼用數百人表示自殺是錯誤的嗎? ,所以 2998 將是 29.98 ~= 30?換句話說,改變計量單位以使數據易於管理是錯誤的嗎?

當您處理具有較大 λ(其參數)值的泊松分佈時,通常使用泊松分佈的正態近似。

正如這個網站所提到的,當 λ 超過 20 時可以使用正態近似值,並且隨著 λ 變得更高,近似值會提高。

泊松分佈僅在由非負整數組成的狀態空間上定義,因此重新縮放和舍入會在您的數據中引入奇怪的東西。

使用正常的大約。對於大型泊松統計是非常常見的。

引用自:https://stats.stackexchange.com/questions/270

comments powered by Disqus