為什麼沒有人使用貝葉斯多項式樸素貝葉斯分類器？

February 8, 2014

所以在（無監督的）文本建模中，潛在狄利克雷分配（LDA）是概率潛在語義分析（PLSA）的貝葉斯版本。本質上，LDA = PLSA + Dirichlet 先於其參數。我的理解是LDA現在是參考算法，並在各種包中實現，而PLSA不應該再使用了。

但是在（有監督的）文本分類中，我們可以對多項樸素貝葉斯分類器做完全相同的事情，並在參數上放置一個狄利克雷先驗。但我認為我從未見過有人這樣做，多項樸素貝葉斯的“點估計”版本似乎是大多數包中實現的版本。有什麼理由嗎？

這是一篇很好的論文，它解決了多項樸素貝葉斯 (MNB) 分類器的一些“系統性”缺點。這個想法是您可以通過一些調整來提高 MNB 的性能。他們確實提到了使用（統一）狄利克雷先驗。

總的來說，如果您對 MNB 感興趣並且尚未閱讀本文，我強烈建議您閱讀。

我還發現了同一個人/人的隨附碩士論文，但我自己還沒有閱讀。你可以檢查一下。

引用自：https://stats.stackexchange.com/questions/85866

comments powered by Disqus

相關問答

在貝葉斯模型中，您可以使用 Uniform(-inf, inf) 作為先驗嗎？

December 18, 2021

Neural-Networks

在實踐中如何實現神經網絡參數的先驗分佈？

September 28, 2021

使用非統計學家的信念生成貝葉斯先驗估計的最佳方法是什麼？

December 3, 2019

適當的先驗和指數似然會導致不適當的後驗嗎？

October 9, 2018

貝葉斯估計器是否要求真實參數是先驗的可能變量？

April 27, 2018

貝葉斯統計如何處理先驗缺失？

February 2, 2018