扩散映射 - 爱码网

扩散映射（diffusion map）

本文出发点：在论文<constraints as features>中，将不连约束的添加转为特征空间的增广，用到了样本在扩散空间的分布，而扩散空间的分布是由扩散映射得到的。

注：蓝色是我的想法，不一定正确

扩散映射是一种降维方法

1. 其通过整合数据的局部几何关系揭示数据集在不同尺度的几何结构。

2. 与PCA (principal component analysis)、MDS (Multidimensional Scaling) 这些降维方法相比，扩散映射非线性，聚焦于发现数据集潜在的流形结构。

3. 优点：对噪声鲁棒，计算代价较低

4. 计算扩散映射的方法：

扩散映射

step1, 计算高斯核矩阵; （若t>1，则计算该矩阵的t次方）

step2,计算扩散矩阵（将核矩阵的行归一化）；

扩散映射

step3,计算扩散矩阵的特征值和特征向量;

step4, 映射到d维扩散空间 -- 在时刻t时，只取前d个特征值和特征向量。

扩散距离 Yi' 如下：

扩散映射

扩散映射是矩阵 P 的 first-enginvector 的第i个元素

5. R中如何使用

调包 library(diffusionMap)

6. t值

Pt(x,y) -- 从 x 经 t 步走到y

（扩散映射

一般取第t轮迭代的kenel matrix。

联系markov链，矩阵 Pt 就是把 transition matrix 矩阵的 t 次方）

若增大t值，就进一步地扩散了每个点的近邻的影响；
若x，y之间有多条路径，其扩散距离就很小；

【参考】

（点1~4 ，来自参考[1]）

[1] De la Porte J, Herbst B M, Hereman W, et al. An introduction to diffusion maps[C]//Proceedings of the 19th Symposium of the Pattern Recognition Association of South Africa (PRASA 2008), Cape Town, South Africa. 2008: 15-25.

（点6，来自参考[2]）

[2] Lafon S, Lee A B. Diffusion maps and coarse-graining: A unified framework for dimensionality reduction, graph partitioning, and data set parameterization [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2006, 28(9): 1393-1403.