為什麼 RANSAC 在統計中沒有得到最廣泛的應用？

July 21, 2010

來自計算機視覺領域，我經常使用RANSAC（隨機樣本共識）方法將模型擬合到具有大量異常值的數據。

但是，我從未見過統計學家使用它，而且我一直認為它不被認為是一種“統計合理”的方法。為什麼呢？它本質上是隨機的，這使得分析變得更加困難，但自舉方法也是如此。

或者僅僅是學術孤島不互相交談的情況？

我認為這裡的關鍵是丟棄了 RANSAC 中的大部分數據。

在大多數統計應用中，某些分佈可能有重尾，因此小樣本數可能會扭曲統計估計。穩健的估計器通過對數據進行不同的加權來解決這個問題。另一方面，RANSAC 沒有嘗試容納異常值，它是為數據點真正不屬於的情況而構建的，而不僅僅是非正態分佈。

引用自：https://stats.stackexchange.com/questions/418

comments powered by Disqus

相關問答

Hypothesis-Testing

統計測試“穩健”意味著什麼？

December 3, 2021

Hypothesis-Testing

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

November 9, 2021

Maximum-Likelihood

為什麼最大似然估計量對異常值是可疑的？

October 5, 2021

隨機森林是否擅長檢測交互項？

January 10, 2021

為什麼不以以下方式進行引導？

October 30, 2020

自舉回歸分析後，所有 p 值都是 0.001996 的倍數

September 20, 2020