（為什麼） Kohonen 風格的 SOM 已經失寵了嗎？

October 19, 2015

據我所知，Kohonen 風格的 SOM 早在 2005 年左右就達到了頂峰，並且最近沒有受到如此多的青睞。我還沒有找到任何論文說 SOM 已被另一種方法包含，或被證明等同於其他方法（無論如何，在更高維度上）。但現在 tSNE 和其他方法似乎獲得了更多的墨水，例如在 Wikipedia 或 SciKit Learn 中，並且 SOM 被更多地作為歷史方法提及。

（實際上，維基百科的一篇文章似乎表明，SOM 仍然比競爭對手具有一定的優勢，但它也是列表中最短的條目。編輯：根據 gung 的要求，我正在考慮的其中一篇文章是：非線性降維. 請注意，與其他方法相比，SOM 關於它的文章較少。我找不到提到 SOM 似乎比大多數其他方法保留的優勢的文章。）

有什麼見解嗎？其他人問為什麼不使用 SOM，並且從前一段時間得到了參考，我已經找到了 SOM 會議的記錄，但想知道 SVM 或 tSNE 等的興起是否剛剛使流行機器學習中的 SOM 黯然失色。

編輯 2：純屬巧合，我今晚剛剛閱讀了 2008 年關於非線性降維的調查，例如它僅提及：Isomap (2000)、局部線性嵌入 (LLE) (2000)、Hessian LLE (2003)、Laplacian eigenmaps (2003) 和半定嵌入 (SDE) (2004)。

我認為您通過注意機器學習目前吹捧為“最佳”降維算法的影響來了解一些事情。雖然 t-SNE 在諸如Merck Viz Challenge等競賽中顯示出其功效，但我個人已經成功地將 SOM 用於特徵提取和二元分類。雖然除了算法的年齡之外，肯定有一些人在沒有正當理由的情況下駁回 SOM（查看這個討論，在過去幾年中也有一些文章發表了實施 SOM 並取得了積極成果（參見Mortazavi 等人， 2013 年；Frenkel 等人，2013 年例如）。谷歌學術搜索將顯示 SOM 仍在許多應用領域中使用。然而，作為一般規則，特定任務的最佳算法正是——特定任務的最佳算法。如果隨機森林對於特定的二元分類任務可能工作得很好，它可能在另一個任務上表現得非常糟糕。這同樣適用於聚類、回歸和優化任務。這種現象與沒有免費午餐定理有關，但這是另一個討論的話題。總之，如果 SOM 在特定任務上最適合您，那麼這就是您應該用於該任務的算法，無論什麼流行。

引用自：https://stats.stackexchange.com/questions/177564

（為什麼） Kohonen 風格的 SOM 已經失寵了嗎？

相關問答

文本挖掘：如何用人工智能對文本（例如新聞文章）進行聚類？

人工神經網絡 ANN 如何用於無監督聚類？

SOM 如何降低數據的維數？

名義/循環變量的 SOM 聚類