將分類數據視為連續數據是否有意義?
在回答關於離散和連續數據的這個問題時,我巧妙地斷言,將分類數據視為連續數據幾乎沒有意義。
從表面上看,這似乎是不言而喻的,但直覺往往是統計數據的糟糕指南,或者至少我的直覺是。所以現在我想知道:這是真的嗎?或者是否有已建立的分析,從分類數據到某個連續體的轉換實際上是有用的?如果數據是有序的,會有所不同嗎?
我將假設一個“分類”變量實際上代表一個序數變量;否則將其視為連續變量沒有多大意義,除非它是@Rob 指出的二進制變量(編碼為0/1)。然後,我會說問題不在於我們處理變量的方式,儘管到目前為止已經開發了許多用於分類數據分析的模型 - 參見例如,有序分類數據的分析:最近的概述和調查Liu 和 Agresti 的發展,而不是我們假設的基本測量尺度。我的回答將集中在第二點,儘管我將首先簡要討論將數字分數分配給變量類別或級別。
通過對序數變量進行簡單的數值重新編碼,您假設該變量具有區間屬性(在 Stevens,1946 年給出的分類意義上)。從測量理論的角度來看(在心理學中),這通常可能是一個太強的假設,但對於基礎研究(即,使用單個項目以清晰的措辭表達對日常活動的看法)任何單調的分數都應該給出可比較的結果. Cochran (1954) 已經指出
任何一組分數都是有效的 測試,只要它們是在沒有參考實驗結果的情況下構建的。如果分數集很差,因為它嚴重扭曲了真正構成有序分類的數字尺度,那麼測試將不敏感。因此,分數應體現對分類的構建和使用方式的最佳洞察力。(第 436 頁)
(非常感謝@whuber 在他的一條評論中提醒我這一點,這讓我重新閱讀了 Agresti 的書,此引文來自該書。)
實際上,一些測試隱含地將這些變量視為區間尺度:例如,用於測試線性趨勢的統計量(作為簡單獨立性的替代)基於相關方法(, Agresti, 2002, p. 87)。
好吧,您也可以決定在不規則範圍內重新編碼您的變量,或聚合它的一些級別,但在這種情況下,重新編碼的類別之間的嚴重不平衡可能會扭曲統計測試,例如前面提到的趨勢測試。@Jeromy 已經提出了分配類別之間距離的一個很好的替代方案,即最佳縮放。
現在,讓我們討論我提出的第二點,即基礎測量模型。當我看到這類問題時,我總是猶豫是否要添加“心理測量學”標籤,因為測量量表的構建和分析屬於心理測量學理論(Nunnally 和 Bernstein,1994,以獲得簡潔的概述)。我不會詳述項目響應理論下的所有模型,我請感興趣的讀者參考 I. Partchev 的教程,項目響應理論的視覺指南,對於 IRT 的簡要介紹,以及最後列出的可能 IRT 分類法的參考文獻 (5-8)。非常簡單地說,這個想法是,不是在變量類別之間分配任意距離,而是假設一個潛在尺度並估計它們在該連續統一體上的位置,以及個人的能力或責任。一個簡單的例子值得很多數學符號,所以讓我們考慮以下項目(來自EORTC QLQ-C30健康相關的生活質量問卷):
你擔心嗎?
它採用四分制編碼,範圍從“一點也不”到“非常多”。原始分數是通過分配 1 到 4 的分數來計算的。然後可以將屬於同一量表的項目的分數加在一起以產生所謂的量表分數,它表示一個人在基礎結構(這裡是心理健康組件)上的排名)。由於評分容易(對於從業者或護士),這種總和的量表分數非常實用,但它們只不過是一個離散的(有序的)量表。
我們還可以考慮支持給定響應類別的概率遵循某種邏輯模型,如上文提到的 I. Partchev 的教程中所述。基本上,這個想法是一種閾值模型(根據比例或累積賠率模型得出等效公式),我們對屬於一個響應類別而不是前一個響應類別的概率或得分高於 a 的概率建模特定類別,以受試者在潛在特徵上的位置為條件。此外,我們可能會強制要求響應類別在潛在量表上等距分佈(這是評級量表模型)——這是我們通過分配規則間隔的數字分數的方式——或者不是(這是部分信用模型) .
顯然,我們並沒有在經典檢驗理論中添加太多內容,其中序數變量被視為數值變量。然而,我們引入了一個概率模型,其中我們假設一個連續的尺度(具有區間屬性)並且可以考慮特定的測量誤差,並且我們可以將這些因子得分插入任何回歸模型中。
參考
- SS史蒂文斯。關於度量衡的理論。科學,103:677-680,1946。
- WG 科克倫。加強共性的一些方法測試。生物識別,10:417-451,1954。
- J Nunnally 和我伯恩斯坦。心理測量理論。麥格勞-希爾,1994
- 艾倫·阿格雷斯蒂。分類數據分析。威利,1990 年。
- CR Rao 和 S Sinharay,編輯。統計手冊,卷。26:心理測量學。Elsevier Science BV,荷蘭,2007 年。
- A Boomsma、MAJ van Duijn 和 TAB Snijders。關於項目反應理論的論文。斯普林格,2001 年。
- D Thissen 和 L Steinberg。項目響應模型的分類。心理測量學,51(4):567–577,1986。
- P Mair 和 R Hatzinger。擴展 Rasch 建模:用於在 R 中應用 IRT 模型的 eRm 包。統計軟件雜誌,20(9),2007。