Pca

如何確定 t-SNE 的參數以減少尺寸?

  • July 9, 2016

我對詞嵌入很陌生。我想可視化學習後文檔的外觀。我讀到 t-SNE 是這樣做的方法。我有 100K 個文檔,其中 250 個維度作為嵌入的大小。也有幾個可用的軟件包。

但是,對於 t-SNE,我不知道我應該保持多少次迭代或 alpha 的值或 perpexility 的值才能更好地學習。

這些是超參數還是可以由某些屬性決定?

我強烈推薦這篇文章如何有效地使用 t-SNE。它具有 tsne 擬合過程的精彩動畫情節,並且是第一個真正讓我直觀地了解 tsne 功能的來源。

在高層次上,困惑是重要的參數。嘗試 5、30 和 50 的 perplexity 並查看結果是個好主意。

但請認真閱讀如何有效使用 t-SNE。它將使您更有效地使用 TSNE。

對於包,在 R 中使用Rtsne ,或者在 python中使用sklearn.manifold.TSNE

引用自:https://stats.stackexchange.com/questions/222912

comments powered by Disqus