Normalization

在應用 t-SNE 之前,數據是否應該居中+縮放?

  • August 6, 2015

我的一些數據特徵的值很大,而其他特徵的值要小得多。

在應用 t-SNE 之前是否有必要對數據進行中心+縮放以防止偏向較大的值?

我使用 Python 的 sklearn.manifold.TSNE 實現和默認的歐幾里得距離度量。

居中無關緊要,因為該算法僅對點之間的距離進行操作,但是如果您希望以同等重要性對待不同的維度,則需要重新縮放,因為 2 範數將更受方差較大的維度的影響。

引用自:https://stats.stackexchange.com/questions/164917

comments powered by Disqus