t分布随机近邻嵌入(t-distributed Stohastic Neighbor Embedding)

基本思路:为高维特征空间在二维平面(或三维超平面,不过基本上总是使用二维空间)上寻找一个投影,使得在原本的n维空间中相距很远的数据点在屏幕上同样相距较远,而原本相近的点在平面上仍然相近。本质上,近邻嵌入寻找保留了样本的邻居关系的新的维度较低的数据表示。

 

参数:

  • perplexity 困惑度
  • step 迭代次数
  • epsilon 学习率

 

 

参考文献:

【1】机器学习开放课程:二、使用Python可视化数据

【2】高维数据可视化之t-SNE算法???? - 知乎(理论推导+实验)

相关文章: