Outliers

為什麼 RANSAC 在統計中沒有得到最廣泛的應用?

  • July 21, 2010

來自計算機視覺領域,我經常使用RANSAC(隨機樣本共識)方法將模型擬合到具有大量異常值的數據。

但是,我從未見過統計學家使用它,而且我一直認為它不被認為是一種“統計合理”的方法。為什麼呢?它本質上是隨機的,這使得分析變得更加困難,但自舉方法也是如此。

或者僅僅是學術孤島不互相交談的情況?

我認為這裡的關鍵是丟棄了 RANSAC 中的大部分數據。

在大多數統計應用中,某些分佈可能有重尾,因此小樣本數可能會扭曲統計估計。穩健的估計器通過對數據進行不同的加權來解決這個問題。另一方面,RANSAC 沒有嘗試容納異常值,它是為數據點真正不屬於的情況而構建的,而不僅僅是非正態分佈。

引用自:https://stats.stackexchange.com/questions/418

comments powered by Disqus