【发布时间】:2011-05-07 11:04:40
【问题描述】:
我正在尝试解决一个简单的分类问题。
问题:
我有一组文本,我必须根据内容对其进行分类。
使用 Mahout 的解决方案:
我知道我必须将输入转换为序列文件才能生成模型。是的,我能够做到这一点。现在,如何对测试数据进行分类? 20News 示例仅测试正确性。但是,我想做实际的分类。
我不确定是否需要编写代码或使用一些现有的类来对测试集进行分类。?
【问题讨论】:
标签: apache machine-learning hadoop mahout