泊松回歸合適嗎？

May 6, 2020

我決定使用泊松回歸來分析體重增加，並想就它是否合適獲得第二意見。

在基線測量體重，幾個月後獲取第二個值，但月數和觀察時間差異很大。所以我認為使用閾值權重增加來定義什麼是事件，計算每個受試者的人時並使用泊松回歸來比較組（要包含在模型中的分組變量）是合適的。每個受試者僅使用一次觀察結果（基線除外），結果將為 0 或 1，具體取決於受試者是否超過體重增加閾值。

*首先，泊松回歸在這種情況下是否合適？

*泊松回歸可以處理多個協變量和它們之間的交互嗎？

*少數受試者有更多的體重測量值（但大多數人沒有），這是一個問題嗎？

泊松回歸似乎不適用於您的情況。

首先，泊松回歸模型很重要，而且你的事件是二元的，所以如果有的話，邏輯回歸會更合適。（泊松回歸可用於對罕見的二元事件進行建模，但我假設您的數據中有如此多的 1，以至於泊松回歸也會預期有多個 2 和幾個 3，並且它們的缺失將使模型比邏輯回歸。）

此外，對於這里和其他地方的許多線程來說，對數據進行二分法是不好的做法。如果您的閾值是體重增加 3 磅，那麼您會將兩個體重增加 3 磅和 20 磅的受試者視為完全相同（兩者的結果都是 1），一個受試者體重增加 2 磅和 1 磅減掉 10 磅（兩者都是 0） - 不用說，這非常（並且人為地）丟掉了很多數據。

我更願意推薦 ANOVA 風格的分析，它可以處理連續的結果變量。在您的情況下，由於您正在處理重複測量（您應該模擬受試者的體重測量是相關的事實），重複測量方差分析（也稱為“混合模型”）將是合適的。您甚至可以指定相隔兩個月進行的兩次測量比相隔四個月進行的兩次測量具有更高的相關性（例如，corCAR在 R 中使用誤差相關性，在 SAS 中以類似的方式）。

重複測量 ANOVA 可以處理預測變量和交互作用（通常稱為“ANCOVA”）。它可以處理對不同主題的不同數量的測量。如果您堅持對數據進行二分法，您甚至可以運行重複測量邏輯回歸。

引用自：https://stats.stackexchange.com/questions/464783

comments powered by Disqus

泊松回歸合適嗎？

相關問答

我已經在回歸中使用了我的整個數據集，我不應該將其用作預測模型嗎？

當我們繪製數據然後在回歸模型中使用非線性變換時，我們是否在窺探數據？

Poisson Gamma Mixture = 負二項分佈？

計數樣本似乎不是泊松分佈，需要進行完整性檢查

時刻和=X1+X2X3+X4X5X6+⋯和=X1+X2X3+X4X5X6+⋯Y=X_1 + X_2 X_3 + X_4 X_5 X_6 +cdots

為什麼即使“所有模型都錯了”，我們還要擔心過擬合？