【发布时间】:2014-12-31 06:52:52
【问题描述】:
我必须在我的 java 代码中使用 WEKA 进行预测。基本上我必须研究给定的代码并重用它。
testdata.setClassIndex(data.numAttributes() - 1);
我无法理解上述行的含义。 什么是类索引?
testdata 和 data 是 Intances 对象。
【问题讨论】:
标签: weka
我必须在我的 java 代码中使用 WEKA 进行预测。基本上我必须研究给定的代码并重用它。
testdata.setClassIndex(data.numAttributes() - 1);
我无法理解上述行的含义。 什么是类索引?
testdata 和 data 是 Intances 对象。
【问题讨论】:
标签: weka
正如here 所述,setClassIndex 用于定义将表示类的属性(用于预测目的)。鉴于索引从零开始,data.numAttributes() - 1 表示测试数据集的最后一个属性。
希望对您有所帮助!
【讨论】:
当您使用分类器将一组数据分类为某些类值时,您会给出一个具有数据属性的实例和一个具有类值的属性。例如,假设您有一组电子邮件作为数据,您必须将它们分类为垃圾邮件/非垃圾邮件。所以你的类属性有两个类值(垃圾邮件,非垃圾邮件)。
通常,类属性添加为实例的最后一个属性(不是必须的)。因此,您必须指示分类器哪个属性是类属性,哪些是其他属性。所以你提到的那条线可以完成这项工作。指示数据实例对象的类索引是什么。
如果您需要更多解释,请在此处发布您的代码。干杯..!
【讨论】:
类索引表示用于分类的目标属性。默认情况下,在 ARFF 文件中,它是最后一个属性,这解释了为什么将其设置为 numAttributes-1。
【讨论】: