Clustering

距離是否必須是層次聚類的“度量”才能在其上有效?

  • August 4, 2011

假設我們定義了N 個項目之間的距離,它不是度量。

基於這個距離,我們然後使用凝聚層次聚類

我們可以使用每個已知算法(單/最大/平均鏈接等)來獲得有意義的結果嗎?或者換一種說法,如果距離不是度量,那麼使用它們有什麼問題?

距離要求取決於層次聚類的方法。單一的、完整的、平均的方法需要距離是非負的和對稱的。Ward、質心、中值方法需要(平方)歐幾里得(比公制更窄的定義)距離來產生幾何上有意義的結果。

(可以通過將他/她的距離矩陣加倍居中來檢查他/她的距離矩陣是否為歐幾里得 見我的回复[]並查看特徵值;如果沒有找到負特徵值,那麼距離確實會在歐幾里得空間中收斂。)

引用自:https://stats.stackexchange.com/questions/13873

comments powered by Disqus