為什麼我們要最大化主成分分析中的方差？

September 28, 2017

我知道在 PCA 中，最大化方差是為了在減少數據維度的過程中盡可能多地保留可變性（或信息）”，我也閱讀了上一個問題：https ://stackoverflow.com/問題/12395542/為什麼我們要在主成分分析期間最大化方差

但是，我還是不太明白為什麼要從矩的角度來最大化方差；例如，我們為什麼不最大化高階矩，例如，聯合最大化多個偶數階矩（根據一些期望的加權方案），為什麼只是二階矩呢？

一個答案是最大化方差可以最小化平方誤差——一個可能更直接合理的目標。

假設我們要降低多個數據點的維數通過投影到單位向量上為 1，並且我們希望保持平方誤差小：

這個優化問題可以轉化為等價問題

在哪裡. 即，最小化平方誤差等價於最大化沿方向的方差（對於居中的數據）。另一個答案是 PCA 試圖將高斯模型擬合到數據中（平方誤差和高斯模型密切相關）。如果您嘗試將另一個模型擬合到您的數據中，您也會觀察到其他時刻（例如，通過獨立分量分析擬合模型時，峰度變得很重要）。

引用自：https://stats.stackexchange.com/questions/305430

comments powered by Disqus

為什麼我們要最大化主成分分析中的方差？

相關問答

當 PCA 不產生降維時，這意味著什麼？

具有混合連續變量和二元變量的 t-SNE

有什麼問題p>`np>`np >` n?

“隨機投影”嚴格來說不是投影嗎？

自動編碼器是否保留距離？

t-SNE 中的坐標軸是什麼意思？

為什麼我們要最大化主成分分析中的方差？

相關問答

當 PCA 不產生降維時，這意味著什麼？

具有混合連續變量和二元變量的 t-SNE

有什麼問題p>np>np >` n?

“隨機投影”嚴格來說不是投影嗎？

自動編碼器是否保留距離？

t-SNE 中的坐標軸是什麼意思？

有什麼問題p>`np>`np >` n?