Multivariate-Analysis
識別多元數據中異常值的最佳方法是什麼?
假設我有一大組包含至少三個變量的多元數據。如何找到異常值?成對散點圖不起作用,因為異常值可能存在於 3 維中,而在任何 2 維子空間中都不是異常值。
我不是在考慮回歸問題,而是在考慮真正的多元數據。因此,涉及穩健回歸或計算槓桿的答案沒有幫助。
一種可能性是計算主成分分數並在前兩個分數的雙變量散點圖中尋找異常值。這能保證有效嗎?有更好的方法嗎?
看看@drknexus所建議的依賴於有序穩健馬哈拉諾比斯距離的 mvoutlier 包。