如何確定 t-SNE 的參數以減少尺寸？

July 9, 2016

我對詞嵌入很陌生。我想可視化學習後文檔的外觀。我讀到 t-SNE 是這樣做的方法。我有 100K 個文檔，其中 250 個維度作為嵌入的大小。也有幾個可用的軟件包。

但是，對於 t-SNE，我不知道我應該保持多少次迭代或 alpha 的值或 perpexility 的值才能更好地學習。

這些是超參數還是可以由某些屬性決定？

我強烈推薦這篇文章如何有效地使用 t-SNE。它具有 tsne 擬合過程的精彩動畫情節，並且是第一個真正讓我直觀地了解 tsne 功能的來源。

在高層次上，困惑是重要的參數。嘗試 5、30 和 50 的 perplexity 並查看結果是個好主意。

但請認真閱讀如何有效使用 t-SNE。它將使您更有效地使用 TSNE。

對於包，在 R 中使用Rtsne ，或者在 python中使用sklearn.manifold.TSNE

引用自：https://stats.stackexchange.com/questions/222912

comments powered by Disqus

如何確定 t-SNE 的參數以減少尺寸？

相關問答

當 PCA 不產生降維時，這意味著什麼？

逆詞嵌入：向量到詞

具有混合連續變量和二元變量的 t-SNE

有什麼問題p>`np>`np >` n?

“隨機投影”嚴格來說不是投影嗎？

自動編碼器是否保留距離？

如何確定 t-SNE 的參數以減少尺寸？

相關問答

當 PCA 不產生降維時，這意味著什麼？

逆詞嵌入：向量到詞

具有混合連續變量和二元變量的 t-SNE

有什麼問題p>np>np >` n?

“隨機投影”嚴格來說不是投影嗎？

自動編碼器是否保留距離？

有什麼問題p>`np>`np >` n?