【问题标题】:How to create ARFF file for 2D data points?如何为二维数据点创建 ARFF 文件?
【发布时间】:2013-12-31 05:40:13
【问题描述】:

我想为 WEKA 创建一个 ARFF 数据集并在其上使用 Nearest Neighbors 分类器。我的数据是具有XY 坐标的二维点,我将使用欧几里得距离来查找邻居。

这是正确的格式吗?

@RELATION name

@ATTRIBUTE X       NUMERIC
@ATTRIBUTE Y       NUMERIC
@ATTRIBUTE class   {classy,classless}

@DATA
0,4,classy
0,6,classy
1,3,classless

谢谢

【问题讨论】:

    标签: classification weka nearest-neighbor


    【解决方案1】:

    您只是在寻找是或否的答案吗?这是具有两个数字属性和一个二进制类的 ARFF 文件的正确格式。此链接提供了有关 ARFF 格式 http://www.cs.waikato.ac.nz/~ml/weka/arff.html 的大量详细信息。

    【讨论】:

    • 我想知道欧几里得距离是否适用于这种格式?
    • 欧几里得距离适用于这种格式。但是,您可能希望使用 consinesimilarity 代替,以防您认为点 (1,2) 和 (100,200) 由于比例而非常相似或接近。 WEKA 的最近邻算法多种多样。您可以在weka.classifiers.lazy 下找到它们。最典型的 IBk 不使用欧几里得距离,如果如文档中所述,它遵循经典的 Aha et al. 论文。其他的也不使用欧几里得距离(根据文档)。
    猜你喜欢
    • 2014-04-01
    • 2014-06-13
    • 2015-06-24
    • 2012-06-03
    • 2012-10-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多