【发布时间】:2016-08-14 16:02:46
【问题描述】:
我正在使用 ELKI-Library 并已使用 DBSCAN 实现了聚类,但由于我使用的数据集随着时间的推移而增长,我想使用增量聚类算法。我发现这个paper 是关于增量 DBSCAN 算法的。该论文称该算法是使用 ELKI 实现的,并且该实现是对 ELKI 的贡献。 但不幸的是,我无法弄清楚如何逐步使用 DBSCAN。
【问题讨论】:
标签: cluster-analysis data-mining dbscan elki
我正在使用 ELKI-Library 并已使用 DBSCAN 实现了聚类,但由于我使用的数据集随着时间的推移而增长,我想使用增量聚类算法。我发现这个paper 是关于增量 DBSCAN 算法的。该论文称该算法是使用 ELKI 实现的,并且该实现是对 ELKI 的贡献。 但不幸的是,我无法弄清楚如何逐步使用 DBSCAN。
【问题讨论】:
标签: cluster-analysis data-mining dbscan elki
我认为我们还没有收到对 ELKI 的捐款。
尝试联系作者。我们将不胜感激。
ELKI 中的 GriDBSCAN 和 ParallelDBSCAN 实现可以修改为执行增量 DBSCAN 集群,只要您只有插入,而不是删除。
但是,构建一个良好的增量 DBSCAN API 要困难得多:应该何时以及如何报告“结果”?常规 DBSCAN 有明确定义的结果,但增量 DBSCAN?两者之间的数据是如何存储的?
如果您的数据集随着时间的推移不断增长,您可能也需要更改参数。例如,减少 epsilon 或增加 minpts。根据您的更新速度,重新运行 DBSCAN 可能同样有效。
【讨论】: