【问题标题】:Topic Distribution over time LDA (months随时间推移的主题分布 LDA(月
【发布时间】:2021-06-24 16:26:42
【问题描述】:
我已经通过 gensim 构建了一个主题模型,并且我还能够使用 pyLDAvis 对其进行分析。但是,我想知道是否可以在整个数据收集过程中可视化主题的分布。
结果应该是一个折线图,从第一个月和主题的概率开始,到最后一个月结束。
如果在一张图表中可视化 3-5 个主题也可以做到这一点,那就太好了。
【问题讨论】:
标签:
jupyter-notebook
distribution
lda
timeline
topic-modeling
【解决方案1】:
有一些主题模型,例如 DTM(Blei 和 Lafferty)、eDTM(Dieng、Blei 等人)、(DTM = 动态主题模型)和随时间变化的主题(Wang 和 McCallum),它们是时间主题模型,可以实现与您想要的类似的东西。如果你有一个大数据集,这些模型不太可行,因为它们需要很长时间才能运行。在这种情况下,最好的办法是将数据集划分为时间段并为每个时间段运行 LDA。一个良好的大规模工作时间主题模型是一个未解决的问题。