逆詞嵌入：向量到詞

August 16, 2019

我正在構建一個生成文本模型，最後一層的輸出是生成詞的詞嵌入（向量）。我的任務是將這個向量轉換回實際的單詞。

有沒有一個很好的算法來做這個反轉？我正在考慮使用全連接/密集層，但隨後它與原始（前向）嵌入層分離。理想情況下，我認為最好以某種方式使用嵌入層的參數進行反演。

沒有一種“正確”的方法可以將詞向量轉回單詞。問題是單詞本身在嵌入空間中形成了一組離散的點，因此模型的輸出不太可能完全等於任何單詞的位置。

通常，如果您的模型發出向量 $ v $ 然後通過找到一個詞來將其解釋為一個詞 $ w $ 帶嵌入 $ v_w $ 這樣 $ d(v, v_w) $ 很小，即 $ v $ 是“接近”的嵌入 $ w $ . 選擇距離函數 $ d $ 取決於您，儘管通常使用餘弦相似度。根據應用程序，您還可以考慮顯示頂部- $ k $ 與您的詞向量相似的詞，這可以提供更多的多樣性。

引用自：https://stats.stackexchange.com/questions/422430

comments powered by Disqus

逆詞嵌入：向量到詞

相關問答