什麼是潛在空間?
在機器學習的上下文中,我經常聽到術語潛在空間,有時用“高維”或“低維”潛在空間這個詞來修飾。
我對這個術語有點困惑(因為它幾乎從未被嚴格定義過)。
有人可以為潛在空間的概念提供定義或動機嗎?
潛在空間是指包含我們無法直接解釋的特徵值的抽像多維空間,但它編碼了外部觀察到的事件的有意義的內部表示。
正如我們人類對廣泛的主題和屬於這些主題的事件有理解一樣,潛在空間旨在通過定量空間表示/建模為計算機提供類似的理解。
在觀察到的數據(事件集)上學習潛在空間(一組隱藏的主題/內部表示)的動機是,觀察到的空間/事件的巨大差異可能是由於潛在空間的微小變化(對於同一主題)。因此,學習潛在空間將有助於模型比觀察數據本身更好地理解觀察到的數據,這是一個非常大的學習空間。
潛在空間的一些例子是:
Word Embedding Space - 由詞向量組成,其中含義相似的詞在空間中具有彼此靠近的向量(通過餘弦相似度或歐幾里德距離測量)和不相關的詞相距很遠(Tensorflow 的嵌入投影儀提供詞嵌入空間的良好可視化)。
圖像特徵空間——最後一層中的 CNN 對輸入圖像中的高級特徵進行編碼,使其能夠有效地檢測,例如,在不同光照條件下輸入圖像中是否存在貓,這是一項艱鉅的任務。原始像素空間。
3)主題建模方法,如LDA、PLSA使用統計方法從觀察到的一組文檔和單詞分佈中獲得一組潛在的主題。(PyLDAvis提供了很好的主題模型可視化)
- VAEs & GANs旨在獲得一個潛在空間/分佈,該潛在空間/分佈與觀察到的數據的真實潛在空間/分佈非常接近。
在上述所有示例中,我們用一個(相對簡單的)多維潛在空間來定量表示複雜的觀察空間,該潛在空間近似於觀察到的數據的真實潛在空間。
術語“高維”和“低維”幫助我們定義我們希望我們的潛在空間學習和表示的特徵種類的具體或*普遍程度。*高維潛在空間對輸入數據的更具體的特徵很敏感,並且在沒有足夠的訓練數據時有時會導致過度擬合。低維潛在空間旨在捕獲學習和表示輸入數據所需的最重要的特徵/方面(一個很好的例子是 VAE 中的低維瓶頸層)。
如果這個答案有幫助,請不要忘記投票:)