Clustering

潛在類分析與聚類分析 - 推理的差異?

  • October 31, 2014

潛在類別分析 (LCA) 與聚類分析在推斷方面有何區別?LCA 假設產生類的潛在潛在變量是否正確,而聚類分析是聚類算法中相關屬性的經驗描述?似乎在社會科學中,LCA 已經流行起來,並且由於它具有正式的卡方顯著性檢驗而被認為在方法上更優越,而聚類分析則沒有。

如果可以以這樣的形式提供示例,那就太好了,“LCA 適合於此(但不適合聚類分析),而聚類分析適合於此(但不適合潛在類分析)。

謝謝!布賴恩

潛在類分析實際上是一個有限混合模型(參見此處)。FMM 與其他聚類算法之間的主要區別在於,FMM 為您提供了一種“基於模型的聚類”方法,該方法使用描述數據分佈的概率模型來派生聚類。因此,您無需使用任意選擇的距離度量來查找集群,而是使用描述數據分佈的模型,並基於該模型評估某些案例是某些潛在類別成員的概率。所以你可以說這是一種自上而下的方法(你從描述數據的分佈開始),而其他聚類算法則是自下而上的方法(你會發現案例之間的相似之處)。

因為您使用統計模型進行數據模型選擇和評估擬合優度是可能的 - 與聚類相反。此外,如果您假設有一些過程或“潛在結構”是數據結構的基礎,那麼 FMM 似乎是一個合適的選擇,因為它們使您能夠對數據背後的潛在結構進行建模(而不是僅僅尋找相似之處)。

另一個區別是 FMM 比集群更靈活。聚類算法只是做聚類,而有基於 FMM 和 LCA 的模型

  • 使您能夠進行確認性的組間分析,
  • 將項目響應理論(和其他)模型與 LCA 相結合,
  • 包括協變量來預測個人的潛在類別成員資格,
  • 和/或什至潛在類回歸中的集群內回歸模型,
  • 使您能夠對數據結構等隨時間的變化進行建模。

有關更多示例,請參見:

Hagenaars JA & McCutcheon, AL (2009)。*應用潛在類分析。*劍橋大學出版社。

以及 R 中flexmixpoLCA包的文檔,包括以下論文:

Linzer, DA 和 Lewis, JB (2011)。poLCA:用於多變量潛在類分析的 R 包。統計軟件雜誌,42(10),1-29。

Leisch, F. (2004)。Flexmix:有限混合模型和潛在玻璃回歸的通用框架,R. Journal of Statistical Software, 11(8), 1-18。

Grün, B. 和 Leisch, F. (2008)。FlexMix 版本 2:具有伴隨變量以及可變和恆定參數的有限混合。統計軟件雜誌,28(4),1-35。

引用自:https://stats.stackexchange.com/questions/122213

comments powered by Disqus