Bayesian
為什麼沒有人使用貝葉斯多項式樸素貝葉斯分類器?
所以在(無監督的)文本建模中,潛在狄利克雷分配(LDA)是概率潛在語義分析(PLSA)的貝葉斯版本。本質上,LDA = PLSA + Dirichlet 先於其參數。我的理解是LDA現在是參考算法,並在各種包中實現,而PLSA不應該再使用了。
但是在(有監督的)文本分類中,我們可以對多項樸素貝葉斯分類器做完全相同的事情,並在參數上放置一個狄利克雷先驗。但我認為我從未見過有人這樣做,多項樸素貝葉斯的“點估計”版本似乎是大多數包中實現的版本。有什麼理由嗎?
這是一篇很好的論文,它解決了多項樸素貝葉斯 (MNB) 分類器的一些“系統性”缺點。這個想法是您可以通過一些調整來提高 MNB 的性能。他們確實提到了使用(統一)狄利克雷先驗。
總的來說,如果您對 MNB 感興趣並且尚未閱讀本文,我強烈建議您閱讀。
我還發現了同一個人/人的隨附碩士論文,但我自己還沒有閱讀。你可以檢查一下。