【发布时间】:2013-12-27 12:10:57
【问题描述】:
我有一个包含 10 列的 .csv 文件。前 9 列与特定项目的属性有关,而第 10 列有“类”,说明它是哪个项目。
我正在尝试运行以下分类器 -
- 朴素贝叶斯
- 零R
- IBK
- 神经网络
我在尝试继续时遇到了一些问题。我应该这样划分我的数据 - 前半部分将被训练并使用后半部分数据测试结果。
我首先转到“资源管理器”并打开 .csv 文件。我选择了所有属性,包括“CLASS”,然后转到分类选项卡。
从那里,我选择“百分比拆分”为 50%,然后简单地“启动”不同的分类器(如前所述)。
所以这些是问题 -
- 是正确的方法吗?
- 我是否也需要将“CLASS”列作为属性包含在内?
- 我可以在 GUI 中进行哪些修改来改进 分类器的测试结果而不更改数据?我是 试图理解这些算法 w.r.t WEKA 的工作原理 好吧,所以想尝试不同的东西。
谁能帮我解决这个问题?
谢谢!
【问题讨论】:
标签: machine-learning classification weka