為什麼 PCA 對異常值敏感？

November 26, 2018

這個 SE 上有很多帖子討論了主成分分析 (PCA) 的穩健方法，但我找不到一個很好的解釋來解釋為什麼PCA 首先對異常值敏感。

原因之一是 PCA 可以被認為是數據的低秩分解，它使總和最小化分解殘差的範數。即如果是你的數據（的向量尺寸），和是 PCA 基 ( 的向量尺寸），那麼分解將嚴格最小化
這裡是 PCA 分解係數的矩陣，並且是矩陣的 Frobenius 範數

因為 PCA 最小化了範數（即二次範數）它與最小二乘或通過對異常值敏感來擬合高斯具有相同的問題。由於離群值偏差的平方，它們將主導總規範，因此將驅動 PCA 組件。

引用自：https://stats.stackexchange.com/questions/378751

為什麼 PCA 對異常值敏感？

相關問答

為什麼最大似然估計量對異常值是可疑的？

如果使用所有 PC，PCA 是否提供優勢？

PCA 名稱中的“組件”一詞應該是單數還是複數？

為什麼 `cooks.distance()` 函數沒有檢測到明顯的異常值？

當 PCA 不產生降維時，這意味著什麼？

結合 PCA、特徵縮放和交叉驗證，而不會洩露訓練測試數據

為什麼 PCA 對異常值敏感？

相關問答

為什麼最大似然估計量對異常值是可疑的？

如果使用所有 PC，PCA 是否提供優勢？

PCA 名稱中的“組件”一詞應該是單數還是複數？

為什麼 cooks.distance() 函數沒有檢測到明顯的異常值？

當 PCA 不產生降維時，這意味著什麼？

結合 PCA、特徵縮放和交叉驗證，而不會洩露訓練測試數據

為什麼 `cooks.distance()` 函數沒有檢測到明顯的異常值？