【问题标题】:How to manually assign topic names to topics generated in LDA如何手动将主题名称分配给 LDA 中生成的主题
【发布时间】:2018-07-08 03:54:09
【问题描述】:

只是在 LDA 中创建的主题示例:

    (0, '0.068*"murder" + 0.043*"crime" + 0.021*"shooting"')
    (1, '0.091*"police" + 0.032*"investigation" + 0.026*"law"')

如何为每个主题手动分配主题标签,例如主题0应命名为“犯罪”,主题1应命名为“警察调查”。

并且在测试新文章时,主题标签应该按照其按降序显示的百分比出现?

【问题讨论】:

  • 你用的是什么库?输出是如何产生的?没有上下文,很难理解这个问题。
  • 对于命令 model.print_topics(num_topics=2) (0, '0.068*"murder" + 0.043*"crime" + 0.021*"shooting"') (1, '0.091*"police " + 0.032*"investigation" + 0.026*"law"') 我想手动分配主题名称,而不是主题 '0' 和主题 '1'
  • 您使用的是哪个库? model 是什么?
  • Gensim LDA 模型
  • 看,主题是由gensim 库本身生成的。你不能强迫它产生你自己的新话题。

标签: python lda topic-modeling


【解决方案1】:

print_topics 返回主题 ID,您必须将其映射和维护到模型外部的英文标签。 documentation

【讨论】:

    猜你喜欢
    • 2015-08-19
    • 2017-02-19
    • 1970-01-01
    • 2017-09-25
    • 2018-07-14
    • 2015-11-15
    • 1970-01-01
    • 2017-01-10
    • 1970-01-01
    相关资源
    最近更新 更多