【问题标题】:Is there a way to input a reachability list into Optics Xi from ELKI and get clusters?有没有办法从 ELKI 将可达性列表输入到 Optics Xi 并获取集群?
【发布时间】:2016-04-08 04:19:52
【问题描述】:

我在将数据正确输入 ELKI 以通过 Optics 算法运行时遇到了一些麻烦,但使用 Optics 的 R 实现,我可以轻松获得可达距离列表。我可以将它们写入这样的文件。 (索引,距离)

1 Inf

2 0.5

3 0.9 ...

我想找到由局部最小值分隔的集群。我认为 ELKI 软件中的 Optics Xi 算法可以做到这一点,但由于我在导入数据时遇到问题,我无法使用它。

使用光学论文中的伪代码以另一种语言编写光学聚类提取算法会更容易吗?我认为在最基本的情况下,它只是在它们彼此相邻时将索引聚集在一起,并且不会减少到新的局部最小值。

谢谢

【问题讨论】:

  • 我敢打赌,您只需要实现一个 Java 接口。在 ELKI 中,一切似乎都有一个可以插入的接口。但是解决你的“一些麻烦”可能更容易,因为 ELKI 工作得非常好(确保启用索引,并在 epsilon 上设置上限 - 这会加快很多速度)。这似乎是唯一可用的 OPTICS 实现。

标签: cluster-analysis elki optics-algorithm


【解决方案1】:

您可以尝试实现接口OPTICSTypeAlgorithm,这在很大程度上意味着读取您的数据并将其存储在ClusterOrder 类型的对象中。

但是,ELKI 包含一个稍微高级的 OPTICS 版本,可以使用 OPTICSXi 产生更好的结果。详细信息最终将作为技术报告左右发布。您从 R 实现中获得的数据不足以纠正 OPTICS 图中的一些常见伪影。

请在 ELKI 中使用 OPTICS 版本。试试 Cover 树索引(它非常快速且易于使用)。避免在输入数据中使用 ID 列,或者告诉解析器哪一列是 ID 列。

【讨论】:

  • 我有一个预先计算的距离矩阵,我已将其重新格式化为 3 列成对距离。即 1 2 0.0895585119724274
  • 当我使用这样的输出时: 当我使用这样的 ELKI 参数时: 参数:-dbc DBIDRangeDatabaseConnection -idgen.start 1 -idgen.count 2424 -time -algorithm clustering.optics.OPTICSList -algorithm .distancefunction external.FileBasedDoubleDistanceFunction -distance.matrix /Users/jperrie/Documents/col3elki.csv -optics.epsilon 5.0 -optics.minpts 2 -resulthandler ResultWriter -out /Applications/elki-0.7.0/opticslisttest1 光学列表没有似乎合作:(
  • 我认为我的 3 列列表有问题。
猜你喜欢
  • 2018-01-09
  • 1970-01-01
  • 2015-09-18
  • 2021-03-24
  • 2020-12-03
  • 2016-02-03
  • 1970-01-01
  • 2015-06-25
  • 2013-04-16
相关资源
最近更新 更多