Time-Series

動態時間規整聚類

  • January 5, 2015

使用動態時間規整 (DTW) 執行時間序列聚類的方法是什麼?

我已經閱讀了 DTW 作為一種在兩個時間序列之間找到相似性的方法,同時它們可以在時間上移動。我可以將此方法用作聚類算法(如 k-means)的相似性度量嗎?

不要時間序列使用 k-means。

DTW沒有被平均最小化;k-means 可能不會收斂,即使收斂也不會產生很好的結果。均值是坐標上的最小二乘估計量。它最小化方差,而不是任意距離,k-means 旨在最小化方差,而不是任意距離

假設您有兩個時間序列。兩個正弦波,頻率相同,採樣週期較長;但它們被抵消了. 由於 DTW 會進行時間扭曲,它可以對齊它們,使它們完美匹配,除了開頭和結尾。DTW 將為這兩個系列分配一個相當小的距離。但是,如果您計算兩個系列的平均值,它將是一個平坦的 0 - 它們相互抵消。均值不做動態時間扭曲,並失去了 DTW 獲得的所有價值。在這樣的數據上,k-means 可能無法收斂,結果將毫無意義。K-means 真的應該只用於方差(= 平方歐幾里得),或者一些等價的情況(如餘弦,在 L2 歸一化數據上,其中餘弦相似度平方歐幾里得距離)

相反,使用 DTW 計算距離矩陣,然後運行層次聚類,例如單鏈接。與 k-means 相比,序列甚至可能有不同的長度。

引用自:https://stats.stackexchange.com/questions/131281

comments powered by Disqus