R
與無序分類變量的相關性
我有一個包含許多觀察結果和許多變量的數據框。其中一些是分類的(無序的),另一些是數字的。
我正在尋找這些變量之間的關聯。我已經能夠計算數值變量的相關性(Spearman 相關性)但是:
- 我不知道如何衡量無序分類變量之間的相關性。
- 我不知道如何衡量無序分類變量和數值變量之間的相關性。
有誰知道如何做到這一點?如果是這樣,是否有實現這些方法的 R 函數?
這取決於您想要什麼樣的相關性。當您運行典型的 Pearson 乘積矩相關性時,您會得到關聯強度的度量,並得到關聯重要性的檢驗。然而,更典型的是,顯著性檢驗和效應大小的測量是不同的。
顯著性測試:
- 連續與標稱:運行ANOVA。在 R 中,您可以使用?aov。
- 標稱與標稱:運行卡方檢驗。在 R 中,您使用?chisq.test。
影響大小(關聯強度):
- 連續與名義:計算組內相關性。在 R 中,您可以在psych包中使用?ICC ;還有一個ICC包。
- 標稱與標稱:計算Cramer’s V。在 R 中,您可以使用vcd包 中的?assocstats 。