【发布时间】:2015-09-25 13:38:48
【问题描述】:
我想使用 Apache Mahout 和使用朴素贝叶斯分类器对一堆文档进行分类。我做了所有的预处理并将我的训练数据集转换为特征向量,然后训练分类器。现在我想将一堆新实例(待分类实例)传递给我的模型,以便对它们进行分类。
但是,我的印象是必须对我的待分类实例和训练数据集进行预处理?如果是这样,我如何在构建模型时没有待分类实例的真实场景中使用分类器?
Apache Spark 怎么样?如何在那里工作?我可以制作一个分类模型,然后用它来分类看不见的实例吗?
【问题讨论】:
标签: apache-spark classification mahout apache-spark-mllib