【发布时间】:2015-10-12 06:18:15
【问题描述】:
我是一个典型的、普通的、日常的 Spark 用户。在Spark's LDA 中有代表的超参数
docConcentration: 用于先验文档在主题上的分布的超参数。当前必须 > 1,其中较大的值鼓励更平滑的推断分布。topicConcentration:主题(词)上的先验主题分布的超参数。当前必须 > 1,其中较大的值鼓励更平滑的推断分布。
这对应于文献中通常分配的 $\alpha$ 和 $\beta$ 参数(和 $k$ - 主题数)LDA 模型的对数似然函数在收敛过程中得到优化。
有谁知道在vowpal wabbit's LDA 模型中是否有任何选项可以在之前设置此类参数/参数?
【问题讨论】:
-
我用 Dirichlet 先验和所有其他 LDA 超参数的文档更新了 wiki。
标签: apache-spark lda vowpalwabbit