Categorical-Data

如何處理計數數據(分類數據),當它已被轉換為速率?

  • August 2, 2010

我正在處理疾病感染數據,我對是否將數據處理為“分類”或“連續”感到困惑。

  • 《感染人數》

    • 在特定時間段內發現的感染病例數,計數由分類數據生成(即標記為“感染”的患者數)
  • 《病床日》

    • 該病房所有患者在該病房停留的總天數的總和,同樣,該計數是從分類數據生成的(即標記為“留在該特定病房”的患者人數)
  • “每病床日的感染人數”

    • “感染計數”/“病床天數”最初都是計數數據,但現在變成了比率

題:

  • 我可以在這裡使用卡方來評估“每病床日感染數”的差異是否具有統計學意義?

更新

我發現我可以比較發病率(或稱其為感染率),但可以進行“發病率差異”(IRD)或“發病率比”(IRR)之類的事情。(我從這裡找到的)

  • IRD 和 t 檢驗有什麼區別?
  • 是否有任何補充 IRR 的統計測試?

對我來說,在這裡使用卡方檢驗聽起來一點也不合適。

我猜你想要做的是:你有不同的病房或治療或任何其他類型的名義變量(即組)來劃分你的數據。對於這些組中的每一個,您都收集了感染計數患者臥床天數,以計算每個患者臥床天數的感染。知道你想檢查組之間的差異,對吧?

如果是這樣,根據 Srikant Vadali 帖子中的原因(如果假設方差同質性和也滿足可比較的組大小)並且beginner應該添加標籤。

引用自:https://stats.stackexchange.com/questions/1099

comments powered by Disqus