Pca

PCA 中的“主要成分”到底是什麼?

  • February 27, 2014

認為是使數據與設計矩陣的投影方差最大化的向量.

現在,我看到了參考資料作為數據的(第一)主成分,也是特徵值最大的特徵向量。

但是,我也看到數據的主要成分是.

明顯地,並且和是不同的東西。誰能在這裡幫助我並告訴我這兩個主成分定義之間有什麼區別?

你的觀察是絕對正確的,即使(協方差矩陣的特徵向量之一,例如第一個)和(將數據投影到跨越的一維子空間) 是兩種不同的東西,它們通常都被稱為“主要成分”,有時甚至在同一個文本中。

在大多數情況下,從上下文中可以清楚地知道確切的含義。然而,在極少數情況下,它確實會讓人感到困惑,例如,當討論一些相關技術(如稀疏 PCA 或 CCA)時,不同的方向不必是正交的。在這種情況下,像“組件是正交的”這樣的陳述具有非常不同的含義,具體取決於它是指軸還是投影。

我會提倡打電話“主軸”或“主要方向”,以及一個“主要組成部分”。

我也看過稱為“主成分向量”。

我應該提到替代約定是調用“主要成分”和“主成分分數”。

兩個約定的總結:


**注意:**只有與非零特徵值對應的協方差矩陣的特徵向量才能稱為主方向/分量。如果協方差矩陣是低秩的,它將有一個或多個零特徵值;對應的特徵向量(和對應的常數為零的投影)不應稱為主方向/分量。在我的回答中查看一些討論。

引用自:https://stats.stackexchange.com/questions/88118

comments powered by Disqus