SVD 和 PCA 之間的關係。如何使用 SVD 執行 PCA？

January 20, 2015

主成分分析 (PCA) 通常通過協方差矩陣的特徵分解來解釋。但是，它也可以通過數據矩陣的奇異值分解 (SVD) 來執行. 它是如何工作的？這兩種方法之間有什麼聯繫？SVD和PCA有什麼關係？

或者換句話說，如何使用數據矩陣的 SVD 進行降維？

讓數據矩陣屬於大小，在哪裡是樣本數和是變量的數量。讓我們假設它是居中的，即列均值已被減去，現在等於零。

然後協方差矩陣是（誰）給的 . 它是一個對稱矩陣，因此可以對角化：
在哪裡是一個特徵向量矩陣（每列是一個特徵向量）和是具有特徵值的對角矩陣在對角線上按降序排列。特徵向量稱為數據的主軸或主方向。數據在主軸上的投影稱為主成分，也稱為PC 分數；這些可以被視為新的、轉換的變量。這 -th 主成分由下式給出 - 第列 . 的坐標 - 新 PC 空間中的第一個數據點由 - 第行 .

如果我們現在執行奇異值分解，我們得到一個分解
在哪裡是一個酉矩陣並且是奇異值的對角矩陣 . 從這裡可以很容易看出意味著右奇異向量是主要方向，奇異值與協方差矩陣的特徵值通過 . 主成分由下式給出 .

總結一下：

如果，然後列是主要方向/軸。

的列是主要成分（“分數”）。

奇異值通過以下方式與協方差矩陣的特徵值相關 . 特徵值顯示各個 PC 的差異。

標準化分數由以下列給出和載荷由列給出 . 例如，請參閱此處和此處，了解為什麼“裝載”不應與主要方向混淆。

**以上是正確的，僅當居中。**只有這樣，協方差矩陣才等於 .

以上僅適用於在行中有樣本，在列中有變量。如果變量在行中，樣本在列中，則和交換解釋。

如果要對相關矩陣（而不是協方差矩陣）執行 PCA，則不僅應該居中，還應該標準化，即除以它們的標準差。

為了減少數據的維數到，選擇的第一列，和的左上角 . 他們的產品是必需的包含第一個矩陣件。

進一步乘以第一個對應主軸的 PC 產量具有原始矩陣大小但等級較低（等級）。這個矩陣提供從第一個原始數據的重建件。它具有最低的重建錯誤，請參閱我的答案here。

嚴格來講，是尺寸和是尺寸。然而，如果然後是最後一個列是任意的（以及相應的行是常數零）；因此，應該使用一個經濟尺寸（或薄）的 SVD，它返回的大小，刪除無用的列。對於大矩陣否則將是不必要的巨大。這同樣適用於相反的情況 .

更多鏈接

SVD 和 PCA 之間的直觀關係是什麼——math.SE 上一個非常流行且非常相似的線程。

為什麼要通過數據的 SVD 對數據進行 PCA？– 討論通過 SVD 執行 PCA 的好處[簡短回答：數值穩定性]。

PCA 和對應分析與 Biplot 的關係——在一些同類技術的背景下，PCA 均基於 SVD。

SVD 比 PCA 有什麼優勢嗎？- 一個問題，詢問使用 SVD代替PCA 是否有任何好處 [簡短回答：不適定問題]。

理解主成分分析、特徵向量和特徵值——我的回答是對 PCA 的非技術性解釋。為了引起注意，我在這裡複製一個圖：

引用自：https://stats.stackexchange.com/questions/134282

SVD 和 PCA 之間的關係。如何使用 SVD 執行 PCA？

更多鏈接

相關問答

使用 R 生成具有零約束的隨機正定矩陣

SVD：為什麼右奇異矩陣寫為轉置

當 PCA 不產生降維時，這意味著什麼？

具有混合連續變量和二元變量的 t-SNE

混合模型：如何推導出亨德森的混合模型方程？

有什麼問題p>`np>`np >` n?

SVD 和 PCA 之間的關係。如何使用 SVD 執行 PCA？

更多鏈接

相關問答

使用 R 生成具有零約束的隨機正定矩陣

SVD：為什麼右奇異矩陣寫為轉置

當 PCA 不產生降維時，這意味著什麼？

具有混合連續變量和二元變量的 t-SNE

混合模型：如何推導出亨德森的混合模型方程？

有什麼問題p>np>np >` n?

有什麼問題p>`np>`np >` n?