【问题标题】:Load the computed LDA models and print the most common words per topic加载计算的 LDA 模型并打印每个主题最常见的单词
【发布时间】:2017-03-09 22:12:06
【问题描述】:

我是 python 新手。我要做的是通过控制台读取 2 个参数。

  1. 参数:使用 gensim 训练的 LDA 模型的路径。
  2. 参数:我希望得到的每个主题最常用词的数量。

现在我想为所有主题打印每个主题最常见单词的数量。现在我的问题是如何获取所有主题。

这是我目前所拥有的:

import sys, getopt
import gensim

def main(argv):
   input_file = argv[0] #LDA Path
   number_of_words = argv[1] #Number of most common word per topic

   ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #load model
   ldamodel.print_topic(?, number_of_words)



if __name__ == "__main__":
   main(sys.argv[1:])

Gensim doc

谢谢

【问题讨论】:

  • ldamodel.print_topic(10, topn=5)

标签: python gensim topic-modeling


【解决方案1】:

get_topic_terms 做你想做的事。我认为主题的数量存储在num_topics 变量中,可通过ldamodel.num_topics 访问。

【讨论】:

  • get_term_topics(word_id, minimum_probability=None) 返回词汇中特定单词最可能的主题。
  • 你应该看get_topic_terms,而不是get_term_topics
  • 那你能纠正这两行吗? ldamodel = gensim.models.ldamodel.LdaModel.load(input_file, mmap=None) #加载模型 ldamodel.print_topic(?, number_of_words)
猜你喜欢
  • 2017-03-09
  • 1970-01-01
  • 1970-01-01
  • 2023-04-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多