Machine-Learning

基於流數據的分類器增量在線學習技術

  • June 6, 2012

哪些可能是面對這個抽象問題的好技術?

您有一個連續信號的數據流,作為來自物理傳感器的數據流。該信號具有真實(離散)值,沒有屬性;可能會提取成癮特徵(例如,功率、自相關、熵)。您可以將有限集中的一個標籤分配給信號的窗口。讓這個標籤成為訓練標籤。您必須選擇窗口的起點和終點以及窗口標籤。

任務是在線分類下一個窗口,就像接收到信號一樣。

我要求一種增量算法,因為它應該在給定更多訓練標籤的情況下提高其檢測性能。但即使只有一個訓練標籤,它也必須能夠分類。

如果由於 windows 邊界檢測而導致問題變得太難,假設您可以將它們的大小固定為一個較小的常數。因此,該算法對信號的小片段進行分類,然後將具有相同標籤的相鄰片段合併。如果您使用這種簡化的方法,請說明為什麼它是合理的。

如果這是一個二元分類問題,那麼應該可以應用在線 SVM,例如Bordes, A. 和 Bottou, L.,“The Huller:一個簡單而高效的在線 SVM”,ECML 2005

如果這是一個非二進制分類(即超過 2 個可能的標籤),您可以查看內核遞歸最小二乘技術。它們是為在線回歸而設計的,但它們在在線分類方面也表現得很好。這是一種基本的 KRLS 算法:Y. Engel、S. Mannor 和 R. Meir,“The Kernel Recusrive Least Squares Algorithm”,IEEE Trans. 信號處理,2004 年

這兩種方法都需要固定的窗口大小來比較相同大小的輸入向量。

引用自:https://stats.stackexchange.com/questions/29862

comments powered by Disqus