【问题标题】:Unable to use precomputed distances with Elki无法通过 Elki 使用预先计算的距离
【发布时间】:2014-10-22 02:27:21
【问题描述】:

我正在尝试对 Elki 使用预先计算的距离,但由于某种原因无法使其正常工作。我已经阅读了这里的说明:http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances 和这个问题:ELKI - input distance matrix

很遗憾,我仍然无法让 ELKI 正常工作。

这是我在 bash shell 中运行的命令:

java -jar  elki.jar -verbose  -dbc.filter FixedDBIDsFilter -dbc.startid 0 -dbc.in elki_dummy_ids -algorithm clustering.kmeans.KMeansLloyd -algorithm.distancefunction external.FileBasedDoubleDistanceFunction -distance.matrix elki_sample_dist_ut.txt -kmeans.k 3

这些是参数中文件的内容:

$cat elki_dummy_ids
0
1
2


$cat elki_sample_dist_ut.txt
0 0 0.0000
0 1 0.8876
0 2 0.8571
1 1 0.0
1 2 0.9059
2 2 0.0

我也尝试了下三角距离矩阵:

$cat elki_sample_dist_lt.txt
0 0 0.0000
1 0 0.8876
1 1 0.0
2 0 0.8571
2 1 0.9059
2 2 0.0

但也没有运气。 我不断收到此错误(已截断 - 如果您需要完整的错误消息,请告诉我):

未处理以下参数: [external.FileBasedDoubleDistanceFunction,-distance.matrix, elki_sample_dist_ut.txt] 任务未完全配置:

参数 algorithm.distancefunction 的值错误。读: de.lmu.ifi.dbs.elki.distance.distancefunction.external.FileBasedDoubleDistanceFunction。 预期:距离函数确定数据库之间的距离 对象。实施 de.lmu.ifi.dbs.elki.distance.distancefunction.PrimitiveDistanceFunction 已知类(默认包 de.lmu.ifi.dbs.elki.distance.distancefunction):

我正在使用 OpenJDK 运行时环境 (IcedTea 2.4.7) (7u55-2.4.7-1ubuntu1)Elki 0.6.0

有人可以指出我在这里缺少什么吗?提前致谢!

【问题讨论】:

    标签: cluster-analysis data-mining k-means elki


    【解决方案1】:

    k-means 不能与预先计算的距离一起使用。

    因为它计算的是从点到 质心 的距离,这是您以前不知道的,因此无法预先计算。

    另外,k-means 应该只用于数值数据,平方欧几里得距离。否则可能无法收敛。 均值最小化平方和偏差,并且不会最小化任意距离

    您可能正在寻找 PAM、k-medoids、DBSCAN、OPTICS、HAC……这些算法确实适用于其他距离,并且只需要成对距离。

    【讨论】:

    • 是的,当然。我被错误消息绊倒了。我刚刚选择了我想到的第一个算法并尝试使用玩具数据集运行它,以确保外部距离文件 parses。 elki 网站提到,在一个特定版本中,解析错误被报告为“参数 algorithm.distancefunction 的错误值”,我错误地认为这就是正在发生的事情。尝试 DBScan,错误消失了 - 谢谢! (顺便说一句,我并没有责怪 Elki,如果看起来是这样,我深表歉意——它是一部很棒的软件!)
    • “责备”可能是一个过于强烈的词。顺便说一句,它是 DBSCAN - 全部大写 - 这是一个首字母缩略词。
    猜你喜欢
    • 2016-04-09
    • 1970-01-01
    • 2020-10-23
    • 2015-09-14
    • 2014-07-02
    • 2014-08-24
    • 1970-01-01
    • 1970-01-01
    • 2016-12-06
    相关资源
    最近更新 更多