【问题标题】:Is PyMC3 useful for creating a latent dirichlet allocation model?PyMC3 对创建潜在狄利克雷分配模型有用吗?
【发布时间】:2015-08-04 00:26:56
【问题描述】:

过去几周我一直在尝试学习 PyMC,我的主要任务是使用它来构建 LDA 主题模型。我最初使用 PyMC2.3 https://stats.stackexchange.com/questions/104771/latent-dirichlet-allocation-in-pymc 尝试了这个示例,但对于一个非常简单的模型,它运行了一夜,甚至从未进入采样步骤。因此我已经切换到 PyMC3。

由于随机变量是分类的,是否存在任何基本限制?有没有人用 PyMC3 成功创建过 LDA 模型?我在Unable to create lambda function in hierarchical pymc3 model 找到了一个部分实现,但没有容器我无法让它工作,而且我认为原作者也不能。有谁知道我可以研究什么资源来弄清楚如何构建它?

【问题讨论】:

标签: python bayesian lda pymc pymc3


【解决方案1】:

TL;DR 链接中给出的实现有效,完整的语音语料库测试代码可见:https://github.com/napsternxg/ipython-notebooks/blob/master/PyMC_LDA.ipynb

我使用 PyMC2 实现了您提到的链接中指定的解决方案,并使其适用于 Inaugural Speech 数据集。我对您提到的链接中提供的解决方案的正确性没有信心,但实施工作并给出了一些主题分布。但是,解释该实现更适合那些更好地理解 LDA 的数学定义的人。

【讨论】:

猜你喜欢
  • 2015-10-07
  • 2011-09-08
  • 2019-06-28
  • 2020-07-21
  • 2017-08-12
  • 2017-04-01
  • 1970-01-01
  • 1970-01-01
  • 2016-09-10
相关资源
最近更新 更多