【发布时间】:2016-05-31 15:21:49
【问题描述】:
我有一个由这张图片表示的数据集。
如您所见,其余数据点顶部有一条细条。问题是我如何使用聚类分析或任何其他技术将条带与其他条带分开。
我尝试了 DBSCAN、KMeans 和层次聚类,并且都给了我类似的结果,图中的颜色显示。
【问题讨论】:
标签: cluster-analysis k-means hierarchical-clustering dbscan
我有一个由这张图片表示的数据集。
如您所见,其余数据点顶部有一条细条。问题是我如何使用聚类分析或任何其他技术将条带与其他条带分开。
我尝试了 DBSCAN、KMeans 和层次聚类,并且都给了我类似的结果,图中的颜色显示。
【问题讨论】:
标签: cluster-analysis k-means hierarchical-clustering dbscan
DBSCAN 和 OPTICS 是您的最佳选择。如果数据不是太大,也可以试试meanshift。但他们将不能够完美地做到这一点 - 有些点对他们来说是“噪音”。 很明显,k-means 和大多数层次聚类都无法解决这个问题。
保持 minPts small(5 到 10),并专注于选择 epsilon。它必须足够小以不覆盖间隙。 OPTICS 会更容易使用,因为您只需要给出 epsilon 的上限。
考虑手动指定模型。调整参数直到你得到你想要的结果不会更好。用尺子在绘图上画一条线,通过读取参数将其转换为线性模型...
【讨论】: