Pca

反轉主成分分數的符號是否可以接受?[複製]

  • June 13, 2012

我有兩個來自類似心理語言學實驗的數據集。在這兩者中,都收集了有關參與者閱讀和拼寫能力的信息,然後將其轉換為標準化分數 zRead 和 zSpell。目的是在檢查實驗的啟動效應時將這些用作協變量。因為這些預測變量是相關的,並且因為理論上將它們的共享方差與其獨特影響區分開來是有用的,所以我正在研究使用主成分,即從 zRead 和 zSpell 分數生成兩個主成分,並將它們用作協變量線性混合模型。

問題在於,雖然每個實驗的主成分相似,PC1 索引共享方差,PC2 區分閱讀和拼寫能力,但 PC2 的符號在每個數據集中是不同的,即:

實驗一相關表:

      zSpell zRead  PC1a   PC2a
zSpell  1.000 0.504 0.867 -0.498
zRead   0.504 1.000 0.867  0.498
PC1a    0.867 0.867 1.000  0.000
PC2a   -0.498 0.498 0.000  1.000

實驗二:

      zSpell  zRead  PC1a   PC2a
zSpell  1.000  0.485 0.862  0.508
zRead   0.485  1.000 0.862 -0.508
PC1a    0.862  0.862 1.000  0.000
PC2a    0.508 -0.508 0.000  1.000

目的是將兩個相關數據集一起呈現,因此解釋 PC2 如何在每個數據集中表示(稍微)不同的事物可能會令人困惑。是否可以通過乘以 -1 來反轉單個組件的分數?如果不是,如果解釋更有意義,是否可以一次反轉所有組件?我看不到這會改變變量的相關結構,但我不確定是否有其他原因可以避免它。

特徵向量的符號本質上是任意的;PC1a如果一位同事要在不同的計算機上對相同的數據進行相同的分析,那麼看到一個或兩個特徵向量(您的, & PC2a)具有不同的符號也就不足為奇了。在同一台計算機上使用相同的數據但通過不同的軟件包計算 PCA 也可以產生相同的效果。

因此,您可以在不改變 PCA 的情況下非常高興地改變特徵向量的符號。

引用自:https://stats.stackexchange.com/questions/30348

comments powered by Disqus

相關問答