【问题标题】:Gensim get topic for a document (seen document)Gensim 获取文档的主题(查看文档)
【发布时间】:2014-05-26 19:10:07
【问题描述】:

我知道在为 gensim 训练了 lda 模型之后,我们可以通过以下方式获得一个看不见的文档的主题:

lda = LdaModel(corpus, num_topics=10)
doc_lda = lda[doc_bow]

但是那些已经用于训练的文档呢?我的意思是有没有一种方法可以获取语料库中用于训练的文档的主题,而不会将其视为新文档?

【问题讨论】:

    标签: python lda gensim


    【解决方案1】:

    没有。

    来自单个文档的信息被提炼到模型中,然后被遗忘。 不保留每个文档的信息(更一般地说:不保留需要 O(#docs) 内存的信息)。

    【讨论】:

    • 但是如果我想得到训练好的文档的主题分布,这样我可以进行某种聚类操作,那我能做什么呢?
    猜你喜欢
    • 2018-03-16
    • 2022-01-14
    • 2020-12-25
    • 1970-01-01
    • 2020-10-02
    • 2017-12-31
    • 1970-01-01
    • 2017-08-17
    • 1970-01-01
    相关资源
    最近更新 更多