Categorical-Data
如何處理計數數據(分類數據),當它已被轉換為速率?
我正在處理疾病感染數據,我對是否將數據處理為“分類”或“連續”感到困惑。
《感染人數》
- 在特定時間段內發現的感染病例數,計數由分類數據生成(即標記為“感染”的患者數)
《病床日》
- 該病房所有患者在該病房停留的總天數的總和,同樣,該計數是從分類數據生成的(即標記為“留在該特定病房”的患者人數)
“每病床日的感染人數”
- “感染計數”/“病床天數”最初都是計數數據,但現在變成了比率
題:
- 我可以在這裡使用卡方來評估“每病床日感染數”的差異是否具有統計學意義?
更新
我發現我可以比較發病率(或稱其為感染率),但可以進行“發病率差異”(IRD)或“發病率比”(IRR)之類的事情。(我從這裡找到的)
- IRD 和 t 檢驗有什麼區別?
- 是否有任何補充 IRR 的統計測試?
對我來說,在這裡使用卡方檢驗聽起來一點也不合適。
我猜你想要做的是:你有不同的病房或治療或任何其他類型的名義變量(即組)來劃分你的數據。對於這些組中的每一個,您都收集了感染計數和患者臥床天數,以計算每個患者臥床天數的感染。知道你想檢查組之間的差異,對吧?
如果是這樣,根據 Srikant Vadali 帖子中的原因(如果假設方差同質性和也滿足可比較的組大小)並且
beginner
應該添加標籤。