當存在更多因素時,提取更多因素總是更好嗎?
與主成分分析不同,因子分析模型的解不一定是嵌套的。也就是說,當僅提取第一個因子與提取前兩個因子時,第一個因子的負載(例如)不一定相同。
考慮到這一點,考慮這樣一種情況,您有一組高度相關的明顯變量,並且(根據對其內容的理論知識)應該由一個因素驅動。想像一下,探索性因素分析(通過您喜歡的任何指標:平行分析、碎石圖、特徵值 >1 等)強烈表明存在因素:主要因素較大,次要因素較小。您對使用清單變量和因子解決方案來估計(即,獲得因子分數)參與者對第一個因子的值感興趣。 在這種情況下,最好:
- 擬合因子模型以僅提取因子,並獲得因子分數(等),或
- 擬合因子模型以提取兩個因子,獲取因子的因子分數,但丟棄/忽略第二個因子的分數?
對於哪個更好的做法,為什麼? 有沒有關於這個問題的研究?
您提到的問題是構建心理測試儀器時的“近似一維性”主題,這在 80 年代的文獻中已經討論了很多。靈感存在於過去,因為從業者希望對他們的項目使用傳統的項目響應理論 (IRT) 模型,而當時這些 IRT 模型僅限於測量一維特徵。因此,希望測試多維性是一種麻煩,(希望)可以避免或忽略。這也是導致在因子分析(Drasgow 和 Parsons,1983 年)和 DETECT 方法中創建並行分析技術的原因。
忽略其他特徵/因素的後果,除了明顯將錯誤的模型擬合到數據(即,忽略有關潛在模型不擬合的信息;儘管它當然可能是微不足道的),是對主導因素的特徵估計將變得有偏差,並且因此效率較低。這些結論當然取決於附加特徵的屬性如何(例如,它們是否與主要維度相關,它們是否具有強載荷,存在多少交叉載荷等),但總體主題是次要估計獲得主要特徵分數將不太有效。請參閱此處的技術報告,了解失配的一維模型和雙因子模型之間的比較;技術報告似乎正是您所追求的。
從實踐的角度來看,在選擇最佳模型以及一般的模型擬合統計量(RMSEA、CFI 等)時,使用信息標準可能會有所幫助,因為忽略多維信息的後果將對數據的整體擬合產生負面影響. 但是,當然,整體模型擬合只是對手頭數據使用不合適模型的一個跡象。完全有可能使用了不正確的函數形式,例如非線性或缺乏單調性,因此也應始終檢查各個項目/變量。
另見:
Drasgow, F. 和 Parsons, CK (1983)。單維項目響應理論模型在多維數據中的應用。應用心理測量,7 (2), 189-199。
Drasgow, F. & Lissak, RI (1983)。改進的平行分析:檢查二分計分項目響應的潛在維度的程序。應用心理學雜誌,68,363-373。
Levent Kirisci、Tse-chi Hsu 和 Lifa Yu (2001)。項目參數估計程序對單維性和正態性假設的魯棒性。應用心理測量,25 (2), 146-162。