Normalization
在應用 t-SNE 之前,數據是否應該居中+縮放?
我的一些數據特徵的值很大,而其他特徵的值要小得多。
在應用 t-SNE 之前是否有必要對數據進行中心+縮放以防止偏向較大的值?
我使用 Python 的 sklearn.manifold.TSNE 實現和默認的歐幾里得距離度量。
居中無關緊要,因為該算法僅對點之間的距離進行操作,但是如果您希望以同等重要性對待不同的維度,則需要重新縮放,因為 2 範數將更受方差較大的維度的影響。