【发布时间】:2017-03-09 22:12:06
【问题描述】:
我是 python 新手。我要做的是通过控制台读取 2 个参数。
- 参数:使用 gensim 训练的 LDA 模型的路径。
- 参数:我希望得到的每个主题最常用词的数量。
现在我想为所有主题打印每个主题最常见单词的数量。现在我的问题是如何获取所有主题。
这是我目前所拥有的:
import sys, getopt
import gensim
def main(argv):
input_file = argv[0] #LDA Path
number_of_words = argv[1] #Number of most common word per topic
ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #load model
ldamodel.print_topic(?, number_of_words)
if __name__ == "__main__":
main(sys.argv[1:])
谢谢
【问题讨论】:
-
ldamodel.print_topic(10, topn=5)
标签: python gensim topic-modeling