加载计算的 LDA 模型并打印每个主题最常见的单词答案

【问题标题】：Load the computed LDA models and print the most common words per topic加载计算的 LDA 模型并打印每个主题最常见的单词
【发布时间】：2017-03-09 22:12:06
【问题描述】：

我是 python 新手。我要做的是通过控制台读取 2 个参数。

参数：使用 gensim 训练的 LDA 模型的路径。
参数：我希望得到的每个主题最常用词的数量。

现在我想为所有主题打印每个主题最常见单词的数量。现在我的问题是如何获取所有主题。

这是我目前所拥有的：

import sys, getopt
import gensim

def main(argv):
   input_file = argv[0] #LDA Path
   number_of_words = argv[1] #Number of most common word per topic

   ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #load model
   ldamodel.print_topic(?, number_of_words)



if __name__ == "__main__":
   main(sys.argv[1:])

Gensim doc

谢谢

【问题讨论】：

ldamodel.print_topic(10, topn=5)

标签： python gensim topic-modeling

【解决方案1】：

get_topic_terms 做你想做的事。我认为主题的数量存储在num_topics 变量中，可通过ldamodel.num_topics 访问。

【讨论】：

get_term_topics(word_id, minimum_probability=None) 返回词汇中特定单词最可能的主题。
你应该看get_topic_terms，而不是get_term_topics
那你能纠正这两行吗？ ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #加载模型 ldamodel.print_topic(?, number_of_words)