【问题标题】:topic proportions in my corpus?我的语料库中的主题比例?
【发布时间】:2015-11-10 16:44:01
【问题描述】:

感谢您阅读并花时间思考和回应。

我正在使用 Gensim 的 Mallet 包装器 (ldamallet.py),它就像一个魅力。我需要为我的语料库(在我所有的文档中)获取主题比例,但我不知道该怎么做。 model.alpha 不是它,因为它没有标准化为 1。另外,alpha 包含我的 Dirichlet 参数,而不是主题比例。我说的对吗?

非常感谢任何帮助。

【问题讨论】:

    标签: lda gensim topic-modeling mallet


    【解决方案1】:

    当您从命令行调用 mallet 时,开关 --output-doc-topics 会为您提供主题组合(作为 csv 文件)。

    【讨论】:

      猜你喜欢
      • 2019-01-10
      • 1970-01-01
      • 2015-05-24
      • 2016-09-24
      • 1970-01-01
      • 1970-01-01
      • 2017-09-28
      • 2019-03-24
      • 1970-01-01
      相关资源
      最近更新 更多