Correlation

對特徵向量的視覺解釋感到困惑:視覺上不同的數據集如何具有相同的特徵向量?

  • November 17, 2014

許多統計教科書提供了協方差矩陣的特徵向量的直觀說明:

在此處輸入圖像描述

向量uz形成特徵向量(好吧,特徵軸)。這是有道理的。但是讓我感到困惑的一件事是我們從相關矩陣中提取特徵向量,而不是原始數據。此外,完全不同的原始數據集可以具有相同的相關矩陣。例如,以下兩者都具有相關矩陣:

特徵向量

因此,它們具有指向同一方向的特徵向量:

但是,如果您對原始數據中特徵向量的方向應用相同的視覺解釋,您將得到指向不同方向的向量。

有人可以告訴我哪裡出錯了嗎?

第二次編輯:如果我可以這麼大膽,下面的優秀答案我能夠理解混亂並說明它。

  1. 視覺解釋與從協方差矩陣中提取的特徵向量不同的事實相一致。

協方差和特徵向量(紅色):

協方差和特徵向量(藍色): 2. 相關矩陣反映了標準化變量的協方差矩陣。標準化變量的目視檢查說明了為什麼在我的示例中提取了相同的特徵向量:

在此處輸入圖像描述

您不必對相關矩陣進行 PCA;您也可以分解協方差矩陣。請注意,這些通常會產生不同的解決方案。(有關這方面的更多信息,請參閱:PCA on correlation or covariance?

在第二個圖中,相關性是相同的,但組看起來不同。它們看起來不同,因為它們具有不同的協方差。但是,方差也不同(例如,紅色組在 X1 的範圍內變化),相關性是協方差除以標準差 ()。結果,相關性可以是相同的。

同樣,如果您使用協方差矩陣對這些組執行 PCA,您將獲得與使用相關矩陣不同的結果。

引用自:https://stats.stackexchange.com/questions/124441

comments powered by Disqus