Dimensionality-Reduction
SOM 如何降低數據的維數?
這是我幾天來一直在努力解決的問題。從我對自組織地圖的研究中,我知道自組織地圖的一個共同特點是降低數據的維數。例如,如果您有一個 3x3 SOM,並且輸入空間由 50 個 10 維向量組成,則 SOM 會將其減少到 50 個 2 維向量。如果我正在創建自己的 SOM,這些數據在哪裡?如果我的問題太模糊或太寬泛,請原諒。附加到 SOM 中每個神經元的參考向量與輸入空間的維度相同。輸入空間本身的維數不會減少。那麼降維數據在哪裡呢?換一種說法,與自組織地圖相關的什麼數據結構包含這些數據?我唯一的猜測是,這些數據可以在自組織地圖中每個節點的位置中找到。
謝謝!
SOM 網格是一個 2 維流形或拓撲空間,10 維空間中的每個觀察都通過其與 SOM 網格中每個單元的原型(代碼簿向量)的相似性映射到該空間。
SOM 網格在全維空間中是非線性的;“網格”在訓練期間被扭曲以更緊密地擬合輸入數據。然而,在降維方面的關鍵點是距離可以在網格的拓撲空間中測量 - 即二維 - 而不是完整的-方面。(在哪裡是變量的數量。)
簡單地說,SOM 是- 二維 SOM 網格上的維度。