【问题标题】:Regarding inference of topic weights from trained model - MALLET关于从训练模型推断主题权重 - MALLET
【发布时间】:2016-10-12 09:42:01
【问题描述】:

我从指定 20 个主题的文本体中训练了一个模型,但是当我在一个新文档上运行推理器时,它只输出 10 个主题权重。这些是我使用的命令:

  1. bin/mallet import-file --input /data/research/bazaarvoice/data/review_nouns.txt --output /data/research/bazaarvoice/data/review_nouns_mallet.mallet --keep-sequence --use -pipe-from /data/research/bazaarvoice/data/ques_mallet.mallet

  2. bin/mallet train-topics \ --输入/data/research/bazaarvoice/data/ques_mallet.mallet \ --num-主题 20 \ --output-topic-keys /data/research/bazaarvoice/data/ques_train_keys.txt \

  3. bin/mallet 推断主题\ --输入 /data/research/bazaarvoice/data/review_nouns_mallet.mallet \ --inferencer-filename /data/research/bazaarvoice/data/ques_train_mallet_topics.txt \ --output-doc-topics /data/research/bazaarvoice/data/review_new_topics.txt

你能告诉我我做错了什么吗?

【问题讨论】:

  • 第二步当然也包括了 output-model 命令,它输出了文件 ques_train_mallet_topics.txt(在推理机中用作训练好的模型)

标签: mallet


【解决方案1】:

--num-topics 20 添加到infer-topics 调用中。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-09-25
    • 1970-01-01
    相关资源
    最近更新 更多