【发布时间】:2017-11-21 23:19:15
【问题描述】:
我已经使用 gensim 训练了一个 LDA 模型。我的印象是 Lda 将数据减少到两个较低级别的矩阵(参考:https://www.analyticsvidhya.com/blog/2016/08/beginners-guide-to-topic-modeling-in-python/),但我似乎无法弄清楚如何访问术语主题矩阵。我可以在 gensim 的文档中找到的唯一参考是 .get_topics() 属性,但是它提供的格式对我来说毫无意义。
应用转换来检索文档主题矩阵很容易,如下所示:
doc_topic_matrix = lda_model[doc_term_matrix]
所以我希望有一种类似的功能方法来生成主题词矩阵。
理想情况下,输出应如下所示:
word1 word2 word3 word4 word5
topic_a .12 .38 .07 .24 .19
topic_b .41 .11 .04 .14 .30
对这是否可能有任何想法?
【问题讨论】: