顯示序數數據 - 均值、中位數和均值秩
我有一些非正態分佈的序數數據,所以我決定使用 Mann-Whitney U 檢驗進行非參數檢驗。我正在查看七個分數的組之間的差異 - 每個主題的這些分數是 0、1、2 或 3。我很難弄清楚如何顯示我的數據!
如果我使用中位數(和中位數的 IQR)呈現數據,則根本不清楚差異在哪裡,因為在大多數情況下,中位數落在 0 或 1 上。因此,儘管 Mann-Whitney U 檢驗顯示出顯著差異,這張桌子看起來很無趣。
我也可以使用手段來呈現數據。有一些科學論文說您可以對序數數據使用均值,但您不能對分數之間的差異做出相同類型的假設(例如,0 和 1 之間的差異與 1 和2)。使用手段會有點爭議,儘管表中的數字在我使用它們時很好地說明了故事。
第三種選擇是使用 SPSS 在 Mann-Whitney 輸出中為我提供的平均排名。平均排名是在組之間進行比較,所以也許我應該只使用這些?我唯一遇到的問題是平均排名對實際數據沒有任何意義(例如,我看不到受試者更接近 3,而對照使用平均排名更接近 1。)
最後一個選項是在將分數分成兩組(0 和 1 表示低,2 和 3 表示高)後,對受試者和對照組進行卡方分析。但是,當我這樣做時,差異並不那麼明顯(可能出於多種原因)。
這是一個很好的問題。正如您所發現的,當數據中有很多聯繫時,分位數不起作用,因為它們作為估計量太不連續。如果您可以假設類別之間的間距至少“有一半意義”,我經常發現均值效果最好。超出概率總是有效的。在你的情況下,這些將通過觀察的比例來估計. 在比較組時,平均排名很有用,但我認為單個變量的用處不大。
使用均值總結序數變量的正確性很少來自數據本身。這是主觀的。
我不會使用平均等級,而是使用適當的等級相關性度量或一致性概率(Wilcoxon-Mann-Whitney 統計量的簡單線性轉換;它是兩組中觀察值的平均等級除以常數)之間兩個變量(例如,二元分組和序數標度)。相關係數的選擇包括 Somers'(這與一致性概率一致,並懲罰序數變量的關係)和 Goodman-Kruskal這不會懲罰任何一方的關係或者.