【发布时间】:2021-05-20 14:43:21
【问题描述】:
我想知道在 Mallet 的 LDA implementation 中使用哪种技术来学习 Dirichlet 先验。
Hanna Wallach 的 Ph.D. thesis 第 2 章对从数据中学习 Dirichlet 先验的现有技术和新技术进行了很好的概述和有价值的评估。
Tom Minka 最初提供了他著名的fixed-point iteration approach,但没有任何评估或建议。
此外,Jonathan Chuang 对之前提出的方法进行了一些比较,包括 Newton−Raphson method。
梁杰红在his blog中说:
一种典型的方法是利用 Monte-Carlo EM 方法,其中 E-step 由 Gibbs 采样近似,而 M-step 是执行一个 基于梯度的优化方法来优化 Dirichlet 参数。 这种方法在 Mallet 包中实现。
Mallet 提到了带有和不带有直方图的 Minka 的定点迭代。
但是,实际使用的method 只是声明:
使用频率直方图了解 Dirichlet 参数
有人可以提供任何描述所使用技术的参考吗?
【问题讨论】:
标签: lda hyperparameters mallet