【发布时间】:2017-07-08 18:03:27
【问题描述】:
我在 Scikit-learn 中使用 局部线性嵌入 (LLE) 方法进行降维。我能找到的唯一示例属于 Scikit-learn 文档here 和here,但我不确定应该如何选择方法的参数。特别是,数据点的维度或样本数与邻居数(n_neighbors)和组件数(n_components)之间是否存在任何关系? Scikit-learn 中的所有示例都使用 n_components=2,总是这样吗?最后,是否还有其他对调整至关重要的参数,或者我应该对其余参数使用默认设置?
【问题讨论】:
-
一个关键问题是:您使用 LLE 做什么?当
n_components=2用于在二维中绘制高维数据时,您会看到它。n_neighbors决定了事物的平滑程度:当您考虑许多邻居时,您将平滑事物之间的边界——也许会过度平滑。您的用例是关键:您的目标是什么。不幸的是,Scikit 文档很差。
标签: python scikit-learn dimensionality-reduction manifold