【问题标题】:Labelled LDA usage标记的 LDA 使用情况
【发布时间】:2013-05-20 08:39:53
【问题描述】:

我正在做一个需要应用主题模型 LDA 的项目。因为我的每个文档都很短,所以我必须使用 Labeled LDA。我在这方面的知识不多,我需要做的就是将 LLDA 应用于我的数据。

在网上搜索后,我在Stanford TMT 上找到了一个 LLDA 实现。我从 Training a Labeled LDA model 部分了解到:我应该在训练之前标记每个输入文档。我是不是误会了什么?

如果我的理解是正确的,这将涉及到标记文档的太多工作。相反,我可以提供单独的主题列表,并在没有标签的情况下训练文档吗?

【问题讨论】:

    标签: machine-learning nlp lda topic-modeling


    【解决方案1】:

    您的理解是正确的:您需要在训练之前标记每个输入文档。

    带标签的 LDA 是一种监督方法,这意味着您需要一个带标签的数据集。

    如果您“必须使用带标签的 LDA”,您就无法摆脱获取带标签数据集的需要。 如果 TMT 中的 LabeledLDA 模型需要一个 LabeledLDADocumentParams 对象,并且要创建它,您需要标签数组。因此,不,不可能在没有标签的情况下训练有标签的 LDA 模型。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-01-02
      • 2016-09-18
      • 1970-01-01
      • 2017-07-07
      • 1970-01-01
      • 2020-07-13
      • 1970-01-01
      • 2018-05-04
      相关资源
      最近更新 更多