【问题标题】:support for other languages in mahout classifier在 mahout 分类器中支持其他语言
【发布时间】:2013-03-10 13:09:38
【问题描述】:

我正在训练 mahout naive-bayes 分类器。我的训练数据具有以下性质:

 Sports --> "text from different languages but related to sports"
 Health --> "text from different languages but related to health"

在这种情况下,mahout 会支持英语以外的数据吗?或其他语言文本将被忽略。

【问题讨论】:

    标签: machine-learning mahout


    【解决方案1】:

    是和不是。分类器很乐意对任何字符串进行操作,并且不会为它们分配意义。语言无关紧要。但是,它绝不会理解“体育”和“驱逐出境”在不同语言中是同一个词。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-01-24
      • 1970-01-01
      • 2015-02-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多