Poisson-Distribution
為過度分散的計數數據選擇泊松回歸的替代方案
我目前正在分析一系列行為實驗的數據,這些實驗都使用以下度量。這個實驗的參與者被要求選擇(虛構的)其他人可以用來幫助解決一系列 10 個字謎的線索。參與者被引導相信這些其他人將獲得或賠錢,這取決於他們在解決字謎方面的表現。線索的幫助程度各不相同。例如,對於 RUNNING 的字謎 NUNGRIN,三個線索可能是:
- 快速移動(無用)
- 你在馬拉鬆比賽中做了什麼(有幫助)
- 並不總是一個健康的愛好(無益)
為了形成衡量標準,我計算了參與者為其他人選擇無用線索的次數(共 10 次)。在實驗中,我使用各種不同的操作來影響人們選擇的線索的有用性。
因為有用性/無用性度量是相當強烈的正偏態(很大一部分人總是選擇 10 個最有用的線索),並且因為該度量是一個計數變量,所以我一直在使用泊松廣義線性模型來分析這些數據。然而,當我對泊松回歸進行更多閱讀時,我發現由於泊松回歸不能獨立估計分佈的均值和方差,它經常低估一組數據中的方差。我開始研究泊松回歸的替代方案,例如準泊松回歸或負二項式回歸。但是,我承認我對這些模型比較陌生,所以我來這裡尋求建議。
有人對這種數據使用哪種模型有任何建議嗎?是否還有其他我應該注意的注意事項(例如,一個特定模型是否比另一個更強大?)?我應該查看哪種診斷方法來確定我選擇的模型是否正確處理了我的數據?
您的結果是 10 條中有用線索的數量,這是一個二項式隨機變量。所以你應該用某種二項式回歸來分析它,可能是準二項式以允許過度分散。請注意,泊松和誤導性命名的負二項分佈適用於無界計數數據。