Isomap 和 LLE
1. 等度量映射(Isomap)
等度量映射 (Isomap, Isometric Mapping) 的假设是低维流形嵌入高维空间之后,直接在高维空间计算直线距离具有误导性。
如下图,两个黑点之间就距离应该是经过流形曲面的红线距离,但是直接计算欧式距离得到的是两点之间的直线距离。

因为流形在局部内近似于一个欧式空间(平面),因此在某个小的局部内计算欧式距离是合理的。于是先建立一个KNN 图,只计算每个点与其最近的 K 个邻居的距离,与其他点的距离设为无穷大。然后使用 Dijkstra 算法或 Floyd 算法计算任意两点之间的最短路径,作为两点之间的距离。最后再使用 MDS 算法进行降维。
2. 局部线性嵌入(LLE)
局部线性嵌入(LLE, Locally Linear Embedding) 试图保持邻域内样本之间的线性关系。其假设样本 xi 的坐标可以表示为其邻居的线性组合:
xi=wijxj+wikxk+wilxl LLE 试图让降维前后上式保持不变。
首先 LLE 在原始空间内,找出每个样本点 xi 的最近的 k 个邻居集合 Qi,然后根据下面的目标函数计算出 wi:
w1,...wmmini=1∑m∥xi−j∈Qi∑wijxj∥22 令 Cjk=(xi−xj)T(xi−xk) ,则上述的 wi 具有闭式解:
wij=∑l,s∈QiCls−1∑k∈QiCjk−1 由于 wi 在降维后不变,因此可以通过 wi 来求出降维后的低维向量 zi
z1,...zmmini=1∑m∥zi−j∈Qi∑wijzj∥22 令 Z=[z1,⋯,zm],Wij=wij,则上述优化目标为:
Zmin∥Z−ZWT∥22s.t.ZZT=I=Zmintr((Z−ZWT)(Z−ZWT)T)=Zmintr(Z(I−WT)(Z(I−WT)T)=Zmintr(Z(I−W)T(I−W)ZT)=Zmintr(ZMZT)
其中 M=(I−W)T(I−W),通过求解 M 的最小的 d′ 个特征值对应的特征向量即为 ZT 的每一列。