【发布时间】:2016-10-12 09:42:01
【问题描述】:
我从指定 20 个主题的文本体中训练了一个模型,但是当我在一个新文档上运行推理器时,它只输出 10 个主题权重。这些是我使用的命令:
bin/mallet import-file --input /data/research/bazaarvoice/data/review_nouns.txt --output /data/research/bazaarvoice/data/review_nouns_mallet.mallet --keep-sequence --use -pipe-from /data/research/bazaarvoice/data/ques_mallet.mallet
bin/mallet train-topics \ --输入/data/research/bazaarvoice/data/ques_mallet.mallet \ --num-主题 20 \ --output-topic-keys /data/research/bazaarvoice/data/ques_train_keys.txt \
bin/mallet 推断主题\ --输入 /data/research/bazaarvoice/data/review_nouns_mallet.mallet \ --inferencer-filename /data/research/bazaarvoice/data/ques_train_mallet_topics.txt \ --output-doc-topics /data/research/bazaarvoice/data/review_new_topics.txt
你能告诉我我做错了什么吗?
【问题讨论】:
-
第二步当然也包括了 output-model 命令,它输出了文件 ques_train_mallet_topics.txt(在推理机中用作训练好的模型)
标签: mallet