参考 http://qiancy.com/2016/11/12/sne-tsne/

数据降维,大体分为线性方法和非线性方法。其中线性方法例如PCA和LDA,而非线性方法又有保留局部特征、基于全局特征等方法。有人整理了一张分类图,下面这张图从网上引用而来:

t-SNE algorithm(t-分布邻域嵌入算法)

相比于其他降维方法,t-SNE是近年比较火热的一种高维数据可视化技术,能够通过降维,将高维数据降维并给出二维或三维的坐标点,从而可以在人能够轻易理解的平面或立体空间内将数据可视化出来。

这个方法是SNE的变种,SNE是Hinton在2002年提出来的方法。Stochastic Neighbor Embedding,好吧,又是embedding。目标是将高维数据映射到低维后,尽量保持数据点之间的空间结构,这样在高维空间里距离较远的点,在低维空间中依然保持较远的距离。在传统的方法中,PCA和MDS是线性技术,用于保持相距较远的数据点之间的低维表示。

Maaten将t-SNE的降维结果与其他7种降维方法的结果,在5种不同的数据集中作了对比。

 

 

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-08-03
  • 2021-06-27
  • 2021-08-24
  • 2021-10-13
  • 2022-12-23
猜你喜欢
  • 2021-10-25
  • 2021-10-12
  • 2021-09-13
  • 2022-12-23
  • 2022-12-23
  • 2021-12-20
  • 2021-08-01
相关资源
相似解决方案