當存在更多因素時，提取更多因素總是更好嗎？

October 8, 2015

與主成分分析不同，因子分析模型的解不一定是嵌套的。也就是說，當僅提取第一個因子與提取前兩個因子時，第一個因子的負載（例如）不一定相同。

考慮到這一點，考慮這樣一種情況，您有一組高度相關的明顯變量，並且（根據對其內容的理論知識）應該由一個因素驅動。想像一下，探索性因素分析（通過您喜歡的任何指標：平行分析、碎石圖、特徵值 >1 等）強烈表明存在因素：主要因素較大，次要因素較小。您對使用清單變量和因子解決方案來估計（即，獲得因子分數）參與者對第一個因子的值感興趣。 在這種情況下，最好：

擬合因子模型以僅提取因子，並獲得因子分數（等），或

擬合因子模型以提取兩個因子，獲取因子的因子分數，但丟棄/忽略第二個因子的分數？

對於哪個更好的做法，為什麼？ 有沒有關於這個問題的研究？

您提到的問題是構建心理測試儀器時的“近似一維性”主題，這在 80 年代的文獻中已經討論了很多。靈感存在於過去，因為從業者希望對他們的項目使用傳統的項目響應理論 (IRT) 模型，而當時這些 IRT 模型僅限於測量一維特徵。因此，希望測試多維性是一種麻煩，（希望）可以避免或忽略。這也是導致在因子分析（Drasgow 和 Parsons，1983 年）和 DETECT 方法中創建並行分析技術的原因。

忽略其他特徵/因素的後果，除了明顯將錯誤的模型擬合到數據（即，忽略有關潛在模型不擬合的信息；儘管它當然可能是微不足道的），是對主導因素的特徵估計將變得有偏差，並且因此效率較低。這些結論當然取決於附加特徵的屬性如何（例如，它們是否與主要維度相關，它們是否具有強載荷，存在多少交叉載荷等），但總體主題是次要估計獲得主要特徵分數將不太有效。請參閱此處的技術報告，了解失配的一維模型和雙因子模型之間的比較；技術報告似乎正是您所追求的。

從實踐的角度來看，在選擇最佳模型以及一般的模型擬合統計量（RMSEA、CFI 等）時，使用信息標準可能會有所幫助，因為忽略多維信息的後果將對數據的整體擬合產生負面影響. 但是，當然，整體模型擬合只是對手頭數據使用不合適模型的一個跡象。完全有可能使用了不正確的函數形式，例如非線性或缺乏單調性，因此也應始終檢查各個項目/變量。

另見：

Drasgow, F. 和 Parsons, CK (1983)。單維項目響應理論模型在多維數據中的應用。應用心理測量，7 (2), 189-199。

Drasgow, F. & Lissak, RI (1983)。改進的平行分析：檢查二分計分項目響應的潛在維度的程序。應用心理學雜誌，68，363-373。

Levent Kirisci、Tse-chi Hsu 和 Lifa Yu (2001)。項目參數估計程序對單維性和正態性假設的魯棒性。應用心理測量，25 (2), 146-162。

引用自：https://stats.stackexchange.com/questions/176099

comments powered by Disqus

當存在更多因素時，提取更多因素總是更好嗎？

相關問答

是否有標準的擬合度量來驗證探索性因素分析？

在因子分析（或 PCA）中，因子載荷大於 1 是什麼意思？

我應該如何處理這個二進制預測問題？

序數或二進制數據是否有因子分析或 PCA？

什麼是 SEM 中截距的直觀定義/解釋？

因子旋轉方法（varimax、oblimin 等） - 名稱的含義以及這些方法的作用是什麼？