Pca
鑑於 PCA 總是旋轉坐標軸,什麼是“旋轉的”和“未旋轉的”主成分?
據我了解,主成分是通過旋轉坐標軸以將它們與最大方差的方向對齊來獲得的。
儘管如此,我一直在閱讀“未旋轉的主成分”,我的統計軟件 (SAS) 為我提供了 varimax 旋轉的主成分以及未旋轉的主成分。在這裡我很困惑:當我們計算主成分時,軸已經旋轉了;那麼為什麼需要另一個輪換呢?“未旋轉的主成分”是什麼意思?
這將是一個非技術性的答案。
你是對的:PCA 本質上是坐標軸的旋轉,選擇使得每個成功的軸盡可能多地捕獲變化。
在某些學科(例如心理學)中,人們喜歡應用 PCA 來解釋結果軸。即他們希望能夠說主軸#1(它是原始變量的某種線性組合)具有某些特殊含義。為了猜測這個意思,他們會查看線性組合中的權重。然而,這些權重往往是雜亂無章的,無法辨別出明確的含義。
在這些情況下,人們有時會選擇稍微修改一下普通的 PCA 解決方案。它們採用一定數量的主軸(根據某些標準被認為是“重要的”),並另外旋轉它們,試圖實現一些“簡單的結構”——即更容易解釋的線性組合。有一些特定的算法可以尋找最簡單的結構;其中之一稱為 varimax。在 varimax 旋轉之後,連續的組件不再捕獲盡可能多的方差!PCA 的這個特性被額外的 varimax(或任何其他)旋轉破壞了。
因此,在應用 varimax 旋轉之前,您有“未旋轉”的主成分。之後,你會得到“旋轉”的主成分。換句話說,這個術語指的是 PCA 結果的後處理,而不是PCA 旋轉本身。
所有這一切都有些複雜,因為旋轉的是載荷而不是主軸。但是,對於數學細節,我在這裡向您(以及任何感興趣的讀者)推薦我的長答案:PCA 後跟旋轉(例如 varimax)是否仍然是 PCA?