Pca

為什麼我們要最大化主成分分析中的方差?

  • September 28, 2017

我知道在 PCA 中,最大化方差是為了在減少數據維度的過程中盡可能多地保留可變性(或信息)”,我也閱讀了上一個問題:https ://stackoverflow.com/問題/12395542/為什麼我們要在主成分分析期間最大化方差

但是,我還是不太明白為什麼要從矩的角度來最大化方差;例如,我們為什麼不最大化高階矩,例如,聯合最大化多個偶數階矩(根據一些期望的加權方案),為什麼只是二階矩呢?

一個答案是最大化方差可以最小化平方誤差——一個可能更直接合理的目標。

假設我們要降低多個數據點的維數通過投影到單位向量上為 1,並且我們希望保持平方誤差小:

這個優化問題可以轉化為等價問題

在哪裡. 即,最小化平方誤差等價於最大化沿方向的方差(對於居中的數據)。 另一個答案是 PCA 試圖將高斯模型擬合到數據中(平方誤差和高斯模型密切相關)。如果您嘗試將另一個模型擬合到您的數據中,您也會觀察到其他時刻(例如,通過獨立分量分析擬合模型時,峰度變得很重要)。

引用自:https://stats.stackexchange.com/questions/305430

comments powered by Disqus