【问题标题】:MALLET tokenizerMALLET 分词器
【发布时间】:2010-09-17 09:25:58
【问题描述】:

您好,我想使用 MALLET 的主题建模,但是当我将数据导入 mallet 时,我可以提供我自己的标记器或文本文档的标记化版本吗?我发现 MALLET 的标记器不适合我的使用...

【问题讨论】:

    标签: nlp tokenize


    【解决方案1】:

    好的,我明白了。只需将我自己的默认标记器替换为串行管道并将其添加到实例列表中。

    【讨论】:

      猜你喜欢
      • 2013-03-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-11-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多