【问题标题】:MALLET topic-inferenceMALLET 主题推理
【发布时间】:2017-05-04 06:29:40
【问题描述】:

我正在尝试根据 MA​​LLET 训练的主题模型推断文档的主题。我在槌目录中使用以下命令

./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs

但它卡在强制转换异常中:

java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer 我该如何解决?

【问题讨论】:

  • 我可以知道为什么bash 被标记在此吗?
  • 看来topic-model 不是--inferencer 参数的有效类型。
  • @sjsam 因为我使用的是 mallet.sh,它是一个 bash 脚本并以 bash 格式获取其 java 代码的参数
  • @Berger 是的,我也这么认为...但问题是应该采用哪种格式?!我将./mallet train-topics 命令的--output-model 用作./mallet infer-topics 的--inferencer

标签: java bash mallet


【解决方案1】:

模型和推理器之间是有区别的。 train-topics 命令中的 --output-model FILENAME 选项会生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME 生成一个小得多的文件(推理器),其中仅包含推理新文档主题所需的参数。

infer-topics 命令需要一个主题推理器,而不是一个完整的模型。您可以通过运行train-topics--input-model FILENAME--inferencer-filename FILENAME 选项以及--num-iterations 0,从现有模型文件创建推理器。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-10-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-07-04
    相关资源
    最近更新 更多