扩散映射(diffusion map)

本文出发点: 在论文<constraints as features>中,将 不连约束 的添加 转为 特征空间的增广,用到了样本在扩散空间的分布,而扩散空间的分布是由扩散映射得到的。

注:蓝色是我的想法,不一定正确


扩散映射是一种降维方法

1. 其通过 整合数据的局部几何关系 揭示 数据集在不同尺度的几何结构。

2. 与PCA (principal component analysis)、MDS (Multidimensional Scaling) 这些降维方法相比,扩散映射 非线性,聚焦于发现数据集潜在的流形结构。

3. 优点:对噪声鲁棒,计算代价较低


4. 计算扩散映射的方法:

扩散映射

step1, 计算高斯核矩阵; (若t>1,则计算该矩阵的t次方) 

step2,计算扩散矩阵(将核矩阵的行归一化);

扩散映射

step3,计算扩散矩阵的特征值和特征向量; 

step4, 映射到d维扩散空间 -- 在时刻t时,只取前d个特征值和特征向量。 

扩散距离 Yi' 如下:

扩散映射

扩散映射 是矩阵 P 的 first-enginvector 的 第i个元素

5. R中如何使用

调包 library(diffusionMap) 


6. t值

  • Pt(x,y) -- 从 x 经 t 步走到y   

扩散映射

一般取第t轮迭代的kenel matrix。

联系markov链,矩阵 Pt 就是把 transition matrix 矩阵的 t 次方

  • 若增大t值,就进一步地扩散了每个点的近邻的影响;
  • 若x,y之间有多条路径,其扩散距离就很小;


【参考】

(点1~4 ,来自参考[1])

[1] De la Porte J, Herbst B M, Hereman W, et al. An introduction to diffusion maps[C]//Proceedings of the 19th Symposium of the Pattern Recognition Association of South Africa (PRASA 2008), Cape Town, South Africa. 2008: 15-25.

(点6,来自参考[2])

[2] Lafon S, Lee A B. Diffusion maps and coarse-graining: A unified framework for dimensionality reduction, graph partitioning, and data set parameterization [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2006, 28(9): 1393-1403.


相关文章: