Pca
兩個相同數據集之間的 CCA 是否等同於該數據集上的 PCA?
閱讀有關兩個隨機向量的典型相關分析 (CCA) 的維基百科和,我想知道主成分分析(PCA)是否與CCA相同?
讓是和是數據矩陣,表示兩個數據集樣本(即對隨機行向量的觀察和) 在他們每個人中。
CCA 尋找一個線性組合變量和線性組合變量使它們彼此之間具有最大的相關性;然後它在與第一對零相關的約束下尋找下一對;等等。
以防萬一(和),一個數據集中的任何線性組合都將具有相關性在另一個數據集中具有相同的線性組合。所以所有的 CCA 對都會有相關性, 對的順序是任意的。唯一剩下的限制是線性組合之間應該是不相關的。有無數種方式可供選擇不相關的線性組合(請注意,權重在維空間),它們中的任何一個都將產生一個有效的 CCA 解決方案。PCA 確實給出了一種這樣的方法,因為任何兩個 PC 的相關性為零。
所以 PCA 解決方案確實是一個有效的 CCA 解決方案,但在這種情況下,有無數個等價的好 CCA 解決方案。
在數學上,CCA 尋找正確的 () 走了 () 的奇異向量, 在這種情況下等於,任何向量都是特徵向量。所以可以是任意的。然後 CCA 獲得線性組合權重為和. 在這種情況下,它歸結為採用任意基礎並將其轉換為,確實會產生不相關的方向。