【发布时间】:2016-06-16 20:23:20
【问题描述】:
我正在尝试根据内容为文章命名,但无法正确设置。我在 R 中使用 LDA 包
基本上,它适合一个生成主题模型,该模型既考虑了文档集合中出现的单词,也考虑了文档之间的链接。
rtm.collapsed.gibbs.sampler(documents, links, K, vocab, num.iterations,
alpha, eta, beta, trace = 0L, test.start = length(documents) + 1L)
rtm.em(documents, links, K, vocab, num.e.iterations, num.m.iterations,
alpha, eta, lambda = sum(sapply(links, length))/(length(links) *(length(links) -1)/2), initial.beta = rep(3, K), trace = 0L,
test.start = length(documents) + 1L, tempering = 0.0)
这不是很好!有人可以帮我解决这个问题吗?
【问题讨论】:
-
你怎么知道它不起作用?
-
@Peter,将其应用于文章示例列表,但效果不佳!
-
您如何定义'一份出色的工作'?
-
@Peter,当我们必须将 LDA 用于主题建模/文档分类时,它是很好的选择。就我而言,我试图根据内容为文章/文档命名,并探索实现它的方法。例如:有一篇文章可以标题为“A SQUIRT OF STEM CELL GEL HEALS BRAIN INJURIES”阅读内容后