Interpretation
LDA 超參數的自然解釋
有人能解釋一下 LDA 超參數的自然解釋是什麼嗎?
ALPHA
和BETA
分別是(每個文檔)主題和(每個主題)單詞分佈的狄利克雷分佈參數。但是,有人可以解釋選擇這些超參數的較大值與較小值的含義嗎?這是否意味著將任何先驗信念放在文檔中的主題稀疏性和單詞的主題互斥性方面?這個問題是關於潛在狄利克雷分配的,但 BGREene 下面的評論指的是線性判別分析,令人困惑的是,它也縮寫為 LDA。
David Blei 向暑期班的學生介紹了 LDA:http: //videolectures.net/mlss09uk_blei_tm/
在第一個視頻中,他廣泛介紹了主題建模的基本概念以及 Dirichlet 分佈如何發揮作用。板符號被解釋為好像觀察到所有隱藏變量以顯示依賴關係。基本上,主題是單詞的分佈和主題的文檔分佈。
在第二個視頻中,他通過一些示例圖展示了 alpha 的效果。alpha 越小,分佈越稀疏。此外,他還介紹了一些推理方法。