具有線性內核的內核 PCA 是否等同於標準 PCA？

June 5, 2014

如果在內核 PCA中我選擇線性內核，結果會不會和普通的線性 PCA不同？解決方案是根本不同的還是存在一些明確定義的關係？

總結：帶有線性核的核主成分分析與標準主成分分析完全等價。

讓是中心的數據矩陣大小與列中的變量和行中的數據點。然後協方差矩陣由下式給出，其特徵向量是主軸，特徵值是 PC 方差。同時，可以考慮所謂的格拉姆矩陣的尺寸。很容易看出它具有相同的特徵值（即 PC 方差），直到因子，其特徵向量是按單位範數縮放的主成分。

這是標準的 PCA。現在，在內核 PCA 中，我們考慮一些函數將每個數據點映射到另一個通常具有更大維度的向量空間，甚至可能是無限的。內核 PCA 的想法是在這個新空間中執行標準 PCA。

由於這個新空間的維度非常大（或無限），因此很難或不可能計算協方差矩陣。但是，我們可以將第二種方法應用於上述 PCA。確實，Gram 矩陣仍將具有相同的可管理性尺寸。該矩陣的元素由下式給出，我們稱之為核函數. 這就是所謂的內核技巧：實際上不需要計算，但只有. 這個 Gram 矩陣的特徵向量將是目標空間中的主成分，也就是我們感興趣的那些。

您的問題的答案現在變得顯而易見。如果，則核格拉姆矩陣簡化為等於標準的 Gram 矩陣，因此主成分不會改變。

一個非常易讀的參考資料是Scholkopf B, Smola A, and Müller KR, Kernel principal component analysis, 1999，請注意，例如在圖 1 中，他們明確地將標準 PCA 稱為使用點積作為核函數的標準 PCA：

引用自：https://stats.stackexchange.com/questions/101344

comments powered by Disqus

具有線性內核的內核 PCA 是否等同於標準 PCA？

相關問答

Matérn協方差函數的基本原理是什麼？

高斯過程的對數邊際似然

SVM = 模板匹配如何？

是否存在任何（深度）神經網絡顯然無法勝過任何其他方法的監督學習問題？

用於核逼近的 Nystroem 方法

內核化 SVM 是否可以使用梯度下降（如果可以，人們為什麼要使用二次規劃）？