【发布时间】:2019-09-11 17:17:59
【问题描述】:
对单个文档使用主题建模是否合理,或者更准确地说,对单个文档使用 LDA-gibbs 方法在数学上是否可以。如果可以,k 和种子的值应该是多少。 另外,对于单个文档和大量文档,k 和种子的作用是什么。
K 和 SEED 是函数 LDA 的变量(在 r studio 中)。 如果我在这个问题的任何地方错了,也请告诉我。
为了讲述我的项目,我试图找出可用于表示单个文档内容的主要主题。
我已经尝试过使用 k=4,7,10。我的部分问题是 k 的值应该更好。
【问题讨论】:
标签: lda topic-modeling topicmodels