PCA的目標函數是什麼？

May 2, 2011

主成分分析可以使用矩陣分解，但這只是實現目標的工具。

如果不使用矩陣代數，你將如何找到主成分？

什麼是目標函數（goal），約束是什麼？

在不嘗試全面介紹 PCA 的情況下，從優化的角度來看，主要目標函數是瑞利商。商中的矩陣是樣本協方差矩陣的（一些倍數）

其中每個是一個向量特點和是矩陣使得第行是. PCA 旨在解決一系列優化問題。序列中的第一個是無約束問題

自從, 上述無約束問題等價於有約束問題

這就是矩陣代數的用武之地。因為是一個對稱的半正定矩陣（通過構造！）它具有形式的特徵值分解

在哪裡是一個正交矩陣（所以）和是具有非負項的對角矩陣這樣. 因此，. 自從被限制在問題的範數為一，那麼也是自從, 憑藉是正交的。

但是，如果我們想最大化數量在約束條件下, 那麼我們能做的最好的就是設置，那是，和為了.

現在，退出相應的，這是我們首先尋求的，我們得到了

在哪裡表示第一列，即最大特徵值對應的特徵向量. 目標函數的值也很容易看出是.

然後通過求解序列找到剩餘的主成分向量（索引為) 的優化問題

所以，問題是一樣的，除了我們添加了額外的約束，即解決方案必須與序列中所有先前的解決方案正交。不難歸納地擴展上述論證以證明問題是，確實，，這的特徵向量.

PCA 解也經常用奇異值分解的形式表示. 要了解原因，讓. 然後所以（嚴格來說，直到簽名翻轉）和.

主成分通過投影找到到主成分向量上。從剛才給出的 SVD 公式，不難看出

用特徵矩陣的 SVD 表示主成分向量和主成分本身的簡單性是 SVD 特徵在 PCA 的某些處理中如此突出的原因之一。

引用自：https://stats.stackexchange.com/questions/10251

comments powered by Disqus

PCA的目標函數是什麼？

相關問答