Pca
反轉主成分分數的符號是否可以接受?[複製]
我有兩個來自類似心理語言學實驗的數據集。在這兩者中,都收集了有關參與者閱讀和拼寫能力的信息,然後將其轉換為標準化分數 zRead 和 zSpell。目的是在檢查實驗的啟動效應時將這些用作協變量。因為這些預測變量是相關的,並且因為理論上將它們的共享方差與其獨特影響區分開來是有用的,所以我正在研究使用主成分,即從 zRead 和 zSpell 分數生成兩個主成分,並將它們用作協變量線性混合模型。
問題在於,雖然每個實驗的主成分相似,PC1 索引共享方差,PC2 區分閱讀和拼寫能力,但 PC2 的符號在每個數據集中是不同的,即:
實驗一相關表:
zSpell zRead PC1a PC2a zSpell 1.000 0.504 0.867 -0.498 zRead 0.504 1.000 0.867 0.498 PC1a 0.867 0.867 1.000 0.000 PC2a -0.498 0.498 0.000 1.000
實驗二:
zSpell zRead PC1a PC2a zSpell 1.000 0.485 0.862 0.508 zRead 0.485 1.000 0.862 -0.508 PC1a 0.862 0.862 1.000 0.000 PC2a 0.508 -0.508 0.000 1.000
目的是將兩個相關數據集一起呈現,因此解釋 PC2 如何在每個數據集中表示(稍微)不同的事物可能會令人困惑。是否可以通過乘以 -1 來反轉單個組件的分數?如果不是,如果解釋更有意義,是否可以一次反轉所有組件?我看不到這會改變變量的相關結構,但我不確定是否有其他原因可以避免它。
特徵向量的符號本質上是任意的;
PC1a
如果一位同事要在不同的計算機上對相同的數據進行相同的分析,那麼看到一個或兩個特徵向量(您的, &PC2a
)具有不同的符號也就不足為奇了。在同一台計算機上使用相同的數據但通過不同的軟件包計算 PCA 也可以產生相同的效果。因此,您可以在不改變 PCA 的情況下非常高興地改變特徵向量的符號。