Pca

關於 PCA 後斜向旋轉的使用

  • September 16, 2010

一些統計軟件包,如 SAS、SPSS 和 R,允許您在 PCA 之後執行某種因子旋轉。

  1. 為什麼在 PCA 之後需要輪換?
  2. 鑑於 PCA 的目的是產生正交尺寸,為什麼要在 PCA 之後應用傾斜旋轉?

我認為關於 PCA 有不同的意見或觀點,但基本上我們經常將其視為一種縮減技術(你將你的特徵空間縮小​​到一個更小的空間,通常更“可讀”,只要你注意正確居中/標準化需要時提供數據)或構建潛在因素的方法或占個體間差異很大一部分的維度(這裡,“個體”代表收集數據的統計單位;可能是國家、人等)。在這兩種情況下,我們構建了原始變量的線性組合,這些組合解釋了方差的最大值(當投影在主軸上時),受到任何兩個主成分之間正交性的約束。現在,所描述的是純粹的代數或數學,我們不認為它是一個(生成)模型,這與因子分析傳統中所做的相反,我們包含一個誤差項來解釋某種測量誤差. 我也喜歡 William Revelle 在他即將出版的使用 R 的應用心理測量手冊中的介紹(第6章),如果我們要分析一個相關矩陣的結構,那麼

第一個[方法,PCA]是一個模型,它根據分量的乘積來近似相關矩陣,其中每個分量是變量的加權線性和,第二個模型[因子分析]也是相關矩陣的近似值兩個因素的乘積,但其中的因素被視為原因而不是變量的結果。

換句話說,使用 PCA,您將每個組件(因子)表示為變量的線性組合,而在 FA 中,這些變量表示為因子的線性組合。眾所周知,這兩種方法通常會產生非常相似的結果(參見例如 Harman,1976 或 Catell,1978),特別是在我們有大量個體和良好比率因子的“理想”情況下:變量(通常是變化的) 2 到 10 之間,具體取決於您考慮的作者!)。這是因為,通過估計相關矩陣中的對角線(就像在 FA 中所做的那樣,並且這些元素被稱為公共性),誤差方差可以從因子矩陣中消除。這就是為什麼 PCA 經常被用作揭示潛在因素或心理結構的方法來代替上個世紀開發的 FA。但是,當我們繼續這樣做時,我們經常希望對結果因子結構(或所謂的模式矩陣)進行更簡單的解釋。然後是旋轉階乘軸的有用技巧,以便我們最大化特定因子上的變量負載,或者等效地達到“簡單結構”。使用正交旋轉(例如VARIMAX),我們保留了因子的獨立性。通過傾斜旋轉(例如 OBLIMIN、PROMAX),我們將其打破,並允許因子相關。這在文獻中引起了很大的爭論,並導致了一些作者(不是心理測量學家,而是 1960 年初的統計學家)

但關鍵是旋轉方法最初是在 FA 方法的背景下開發的,現在通常與 PCA 一起使用。我不認為這與主成分的算法計算相矛盾:你可以按照你想要的方式旋轉你的階乘軸,只要你記住一旦相關(通過傾斜旋轉),階乘空間的解釋就變得不那麼明顯了。

在開發新問卷時經常使用 PCA,儘管在這種情況下 FA 可能是更好的方法,因為我們正在嘗試提取考慮到測量誤差的有意義的因素,並且可以自行研究其關係(例如,通過分解結果模式)矩陣,我們得到一個二階因子模型)。但 PCA 也用於檢查已驗證的階乘結構。研究人員對 FA 與 PCA 的關係並不在意,比如 500 名有代表性的受試者被要求對涉及五個維度的 60 項問捲進行評分(NEO-FFI就是這種情況),例如),我認為他們是對的,因為在這種情況下,我們對識別生成模型或概念模型不太感興趣(此處使用“代表性”一詞來緩解測量不變性的問題)。

現在,關於旋轉方法的選擇以及為什麼有些作者反對嚴格使用正交旋轉,我想引用 Paul Kline 的話,正如我在回答以下問題時所做的那樣,FA:選擇旋轉矩陣,基於“簡單結構”標準”

(…) 在現實世界中,認為作為行為的重要決定因素的因素會相互關聯並不是不合理的。——P. Kline, 情報。心理測量學觀點,1991,p。19

因此,我會得出結論,根據您的研究目標(您是否想突出相關矩陣的主要模式,或者您是否尋求對可能導致您觀察此類相關矩陣的潛在機制提供合理的解釋),您可以選擇最合適的方法:這與線性組合的構造無關,而僅與您想要解釋生成的階乘空間的方式有關。

參考

  1. 哈曼,HH (1976)。現代因素分析。芝加哥,芝加哥大學出版社。
  2. 卡特爾,RB (1978)。因子分析的科學應用。紐約,全會。
  3. 克萊恩,P. (1991)。智力。心理測量學觀點。勞特利奇。

引用自:https://stats.stackexchange.com/questions/2742

comments powered by Disqus