Time-Series
時間序列主題和矩陣配置文件算法是否適合我的問題?
我有大量的多元時間序列要分析(TB 級數據),我需要快速、可擴展的算法來完成兩個主要任務:
- 在時間序列中找到相似的模式。例如,假設我在參考時間序列中識別出某種模式。我有一組不同的時間序列,我想知道在哪些時間序列中我可以找到相似的模式(比如說,相似的形狀),以及時間序列的哪一部分。過去,我使用 Dynamic Time Warping 作為時間序列之間相似性的度量(更準確地說,作為度量),我非常喜歡它,因為它是一種非常直觀的方法。但是,DTW 並不是我所說的“可擴展”算法(但我可能錯了,在這種情況下請糾正我)。相反,有人告訴我應該切換到 SAX。
- 多變量時間序列的異常檢測。例如,我從一台處於“正常運行”狀態的機器獲取多個傳感器測量值。然後我為同一台機器獲取更多數據。我需要確定機器的行為何時與我認為的“正常操作”有很大不同。
看看 Mueen 和 Keogh 關於Matrix Profile的教程,我認為它可能對我的目標有所幫助(或者至少時間序列主題可能會有所幫助)。但是,我不熟悉這種用於時間序列分析的算法(我一般不是時間序列專家)。因此,在開始一項耗時的文獻研究之前,我想知道:
- 我對嗎?這些工具對我的目標有用嗎,還是有更好的方法?
- 你能給我關於這些工具的直覺嗎?當然,我不希望您向我展示詳細的實現,而是可以幫助我更快地消化相關文獻的東西。
是的,Matrix Profile 允許發現不和諧,這對於異常檢測非常有競爭力(根據多個獨立測試)
是的,雖然“發現時間序列之間的相似性”有點模糊而無法明確回應,但 Matrix Profile 確實做到了。
如果您給教程的作者(我)寫信,附上一些數據樣本,他會提供更多建議。