【发布时间】:2014-11-06 10:34:51
【问题描述】:
我正在做一个项目,我需要找到一个用 java 编写的专门用于文档分类的机器学习库。谁能给我一些例子?
【问题讨论】:
标签: java machine-learning nlp document-classification
我正在做一个项目,我需要找到一个用 java 编写的专门用于文档分类的机器学习库。谁能给我一些例子?
【问题讨论】:
标签: java machine-learning nlp document-classification
机器学习框架 MALLET (http://mallet.cs.umass.edu/classification.php) 和 Weka (http://www.cs.waikato.ac.nz/ml/weka/) 都可以进行文档分类。与 Mahout 或 Spark 相比,它们都很容易上手。
【讨论】:
取决于您要寻找的机器学习类型。
问题的语言部分(解析文档、提取实体等)可以显着改善结果,还有 ML 算法部分。 对于后者,请查看 Apache Mahout,例如 - 它还附带文档分类的示例。特别是如果您打算处理大量数据。斯坦福分类器也是一个不错的选择。
【讨论】:
【讨论】: