【发布时间】:2017-01-31 08:43:30
【问题描述】:
我想了解更多关于LDA模型中是否有设置超参数alpha和theta的规则。我运行库 gensim 提供的 LDA 模型:
ldamodel = gensim.models.ldamodel.LdaModel(corpus, num_topics=30, id2word = dictionary, passes=50, minimum_probability=0)
但我对超参数的规范有疑问。根据我在库文档中的红色,两个超参数都设置为 1/主题数。鉴于我的模型有 30 个主题,两个超参数都设置为共同值 1/30。我在描述经济活动的新闻文章中运行该模型。出于这个原因,我希望文档主题分布(theta)很高(文档中的相似主题),而主题词分布(alpha)也很高(主题共享许多共同的词,或者不对每个主题都如此独特)。因此,鉴于我对超参数的理解是正确的,1/30 是正确的规范值吗?
【问题讨论】: