【发布时间】:2015-09-24 19:03:34
【问题描述】:
我是 ELKI 新手,我已经成功调整了我想运行的算法。 我在 3K 坐标上使用它并且速度非常快 - 所以现在我正试图扩大到大约 1 MM 记录。现在我正在运行 30K,但已经有几个小时了,它仍在运行。
有什么方法可以提高性能吗?我注意到 java.exe *32 仅使用 ~13% CPU 和 150KB 内存(机器是 2.8 GHz i7 和 32 GB RAM)
根据其他人之前关于仅使用 2 维(经度/纬度)的建议,我使用了 1024 页面大小
直接从 Windows 命令行运行:
java -jar <path> cli
-algorithm clustering.optics.OPTICSXi
-opticsxi.xi 0.006
-optics.minpts 5
-dbc.in <path>
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-pagefile.pagesize 1024
-spatial.bulkstrategy SortTileRecursiveBulkSplit
-algorithm.distancefunction geo.LngLatDistanceFunction
-geo.model WGS84SpheroidEarthModel
-opticsxi.algorithm OPTICSHeap
-resulthandler ResultWriter
-out <path>
【问题讨论】:
-
如果不设置 epsilon,索引将无济于事。
-
啊,我明白了。默认我认为是无穷大,这意味着除非我设置上限,否则索引基本上没有帮助。