Factor-Analysis

如何正確解釋探索性因素分析中的平行分析?

  • May 15, 2014

一些科學論文以與我對方法論的理解不一致的方式報告了主軸因子分析的平行分析結果。我錯過了什麼?我錯了還是他們錯了。

例子:

  • **數據:**在 10 項任務中觀察了 200 個人的表現。對於每個人和每項任務,都有一個績效分數。現在的問題是確定有多少因素是導致這 10 個任務的性能的原因。
  • **方法:**平行分析以確定要保留在主軸因素分析中的因素數量。
  • 報告結果示例: “平行分析表明,僅應保留特徵值為 2.21 或更大的因子”

那是胡說八道,不是嗎?

來自 Horn (1965) 的原始論文和 Hayton 等人的教程。(2004) 我知道並行分析是基於隨機數據對 Kaiser 準則(特徵值 > 1)的改編。但是,適應不是用另一個固定數字代替截止值 1,而是每個因素的單獨截止值(並且取決於數據集的大小,即 200 乘以 10 分數)。看看 Horn (1965) 和 Hayton 等人的例子。(2004 年)和 R 函數的輸出fa.parallelpsych包中並在nFactors中**並行包,我看到並行分析在 Scree 圖中產生了一條向下傾斜的曲線,以與真實數據的特徵值進行比較。更像是“如果特徵值 > 2.21,則保留第一個因子;如果其特徵值 > 1.65,則另外保留第二個;……”。

是否有任何合理的設置、任何思想流派或任何方法可以使“並行分析表明只有特徵值為 2.21 或更高的因子應該保留”正確?

參考:

Hayton, JC, Allen, DG, Scarpello, V. (2004)。探索性因素分析中的因素保留決策:平行分析教程。組織研究方法,7(2):191-205。

霍恩,JL(1965 年)。因子分析中因子數量的基本原理和檢驗。心理測量學,30(2):179-185。

有兩種等價的方式來表示並行分析準則。但首先我需要解決文獻中普遍存在的誤解。

誤解

所謂的 Kaiser 規則(如果您閱讀他 1960 年的論文,Kaiser 實際上並不喜歡該規則)大於 1 的特徵值被保留用於主成分分析。使用所謂的 Kaiser 規則,大於的特徵值被保留用於主因子分析/公因子分析。多年來出現了這種混淆,因為一些作者在使用“因子分析”標籤來描述“主成分分析”時草率地使用它們,而它們並不是一回事。

如果您需要在這一點上令人信服,請參閱Gently Clarifying the Application of Horn’s Parallel Analysis to Principal Component Analysis Vers Factor Analysis的數學。

Parallel Analysis Retention Criteria

用於基於相關矩陣的主成分分析變量的數量,你有幾個數量。首先,您從數據的相關矩陣的特徵分解中獲得觀察到的特徵值,. 其次,你有來自“大量”隨機(不相關)數據集的相關矩陣的特徵分解的平均特徵值和作為自己的,.

霍恩還用“抽樣偏差”來構建他的例子,並估計這種偏差特徵值(用於主成分分析)為. 然後可以使用此偏差來調整觀察到的特徵值,因此:

給定這些數量,您可以表達保留標準以兩種數學上等效的方式觀察到主成分並行分析的特徵值:

主因子分析/公因子分析呢?這裡我們要記住,偏差對應的平均特徵值:(減零,因為對角線被公用矩陣替換的相關矩陣的特徵分解的 Kaiser 規則是保留大於零的特徵值)。因此這裡.

因此主因子分析/公因子分析的保留標準應表示為:

請注意,表達保留標準的第二種形式對於主成分分析和公因子分析都是一致的(即,因為變化取決於成分/因素,但保留標準的第二種形式不表示為)。

還有一件事……

主成分分析和主因子分析/共同因子分析都可以基於協方差矩陣而不是相關矩陣。因為這改變了關於總方差和共同方差的假設/定義,所以在基於協方差矩陣進行分析時,應該只使用保留標準的第二種形式。

引用自:https://stats.stackexchange.com/questions/97802

comments powered by Disqus