Pca

PCA的目標函數是什麼?

  • May 2, 2011

主成分分析可以使用矩陣分解,但這只是實現目標的工具。

如果不使用矩陣代數,你將如何找到主成分?

什麼是目標函數(goal),約束是什麼?

在不嘗試全面介紹 PCA 的情況下,從優化的角度來看,主要目標函數瑞利商。商中的矩陣是樣本協方差矩陣的(一些倍數)

其中每個是一個向量特點和是矩陣使得第行是. PCA 旨在解決一系列優化問題。序列中的第一個是無約束問題

自從, 上述無約束問題等價於有約束問題

這就是矩陣代數的用武之地。因為是一個對稱的半正定矩陣(通過構造!)它具有形式的特徵值分解

在哪裡是一個正交矩陣(所以) 和是具有非負項的對角矩陣這樣. 因此,. 自從被限制在問題的範數為一,那麼也是自從, 憑藉是正交的。

但是,如果我們想最大化數量在約束條件下, 那麼我們能做的最好的就是設置, 那是,和為了.

現在,退出相應的,這是我們首先尋求的,我們得到了

在哪裡表示第一列,即最大特徵值對應的特徵向量. 目標函數的值也很容易看出是.


然後通過求解序列找到剩餘的主成分向量(索引為) 的優化問題

所以,問題是一樣的,除了我們添加了額外的約束,即解決方案必須與序列中所有先前的解決方案正交。不難歸納地擴展上述論證以證明問題是,確實,, 這的特徵向量.


PCA 解也經常用奇異值分解的形式表示. 要了解原因,讓. 然後所以(嚴格來說,直到簽名翻轉)和.

主成分通過投影找到到主成分向量上。從剛才給出的 SVD 公式,不難看出

用特徵矩陣的 SVD 表示主成分向量和主成分本身的簡單性是 SVD 特徵在 PCA 的某些處理中如此突出的原因之一。

引用自:https://stats.stackexchange.com/questions/10251

comments powered by Disqus

相關問答