Clustering

如何在加權社交網絡/圖中進行社區檢測?

  • September 21, 2010

我想知道在具有加權邊的圖上執行社區檢測/圖分區/聚類時,是否有人可以建議什麼是好的起點。有問題的圖有大約 300 萬條邊,每條邊表示它連接的兩個頂點之間的相似程度。特別是,在這個數據集中,邊是個體,頂點是衡量他們觀察到的行為的相似性。

過去,我遵循了我在 stats.stackexchange.com 上獲得的建議,並使用了 igraph 的 Newman 模塊化聚類實現,並對結果感到滿意,但這是在未加權的數據集上。

有沒有我應該看的特定算法?

紐曼模塊化聚類(fastgreedy 函數)的 igraph 實現也可以與加權邊一起使用。只需將權重屬性添加到邊緣並照常分析。以我的經驗,它使用重量跑得更快,因為有更少的關係。

引用自:https://stats.stackexchange.com/questions/2948

comments powered by Disqus