潛在類分析與聚類分析 - 推理的差異？

October 31, 2014

潛在類別分析 (LCA) 與聚類分析在推斷方面有何區別？LCA 假設產生類的潛在潛在變量是否正確，而聚類分析是聚類算法中相關屬性的經驗描述？似乎在社會科學中，LCA 已經流行起來，並且由於它具有正式的卡方顯著性檢驗而被認為在方法上更優越，而聚類分析則沒有。

如果可以以這樣的形式提供示例，那就太好了，“LCA 適合於此（但不適合聚類分析），而聚類分析適合於此（但不適合潛在類分析）。

謝謝！布賴恩

潛在類分析實際上是一個有限混合模型（參見此處）。FMM 與其他聚類算法之間的主要區別在於，FMM 為您提供了一種“基於模型的聚類”方法，該方法使用描述數據分佈的概率模型來派生聚類。因此，您無需使用任意選擇的距離度量來查找集群，而是使用描述數據分佈的模型，並基於該模型評估某些案例是某些潛在類別成員的概率。所以你可以說這是一種自上而下的方法（你從描述數據的分佈開始），而其他聚類算法則是自下而上的方法（你會發現案例之間的相似之處）。

因為您使用統計模型進行數據模型選擇和評估擬合優度是可能的 - 與聚類相反。此外，如果您假設有一些過程或“潛在結構”是數據結構的基礎，那麼 FMM 似乎是一個合適的選擇，因為它們使您能夠對數據背後的潛在結構進行建模（而不是僅僅尋找相似之處）。

另一個區別是 FMM 比集群更靈活。聚類算法只是做聚類，而有基於 FMM 和 LCA 的模型

使您能夠進行確認性的組間分析，

將項目響應理論（和其他）模型與 LCA 相結合，

包括協變量來預測個人的潛在類別成員資格，

和/或什至潛在類回歸中的集群內回歸模型，

使您能夠對數據結構等隨時間的變化進行建模。

有關更多示例，請參見：

Hagenaars JA & McCutcheon, AL (2009)。*應用潛在類分析。*劍橋大學出版社。

以及 R 中flexmix和poLCA包的文檔，包括以下論文：

Linzer, DA 和 Lewis, JB (2011)。poLCA：用於多變量潛在類分析的 R 包。統計軟件雜誌，42（10），1-29。

Leisch, F. (2004)。Flexmix：有限混合模型和潛在玻璃回歸的通用框架，R. Journal of Statistical Software, 11(8), 1-18。

Grün, B. 和 Leisch, F. (2008)。FlexMix 版本 2：具有伴隨變量以及可變和恆定參數的有限混合。統計軟件雜誌，28（4），1-35。

引用自：https://stats.stackexchange.com/questions/122213

comments powered by Disqus

潛在類分析與聚類分析 - 推理的差異？

相關問答

概率 PCA 中的主要子空間是什麼？

MIMIC 因子和帶指標的複合因子 (SEM) 有什麼區別？

LDA 與 word2vec

為什麼EM算法名稱中有E？

參數與潛在變量

當 CFA 模型出現“協方差矩陣不是正定的”問題時，是由於數據集還是模型？