【问题标题】:Issues in using lda for vowpal wabbit将 lda 用于 vowpal wabbit 的问题
【发布时间】:2014-04-04 19:38:30
【问题描述】:

我正在尝试使用 vowpal wabbit lda 模型。但我的结果很糟糕。我认为我正在做的过程有问题。我的词汇量为 100000。

我这样运行代码

vw --data train.txt --lda 50 --lda_alpha 0.1 --lda_rho 0.1 --lda_D 262726 -b 20 -pions.dat --readable_model wordtopics.dat

现在我希望 wordtopics.dat 文件包含这 100000 个单词的主题比例,但看起来这个单词 topics.dat 文件非常大,包含 1048587 行。

我认为是因为b = 20,而最后的行就像具有均匀的概率分布。

但是,当我查看获得的主题时,它们根本没有意义。所以我觉得有些不对劲。有什么问题吗?

【问题讨论】:

    标签: topic-modeling


    【解决方案1】:

    没有回答您的问题,但哥伦比亚大学应用数据科学学院的人已发送helper 与大众的 LDA 合作,尤其是在查看结果方面。

    还可以尝试使用--passes 选项,这样 VW 的结果可能会比一些训练更好。

    【讨论】:

      猜你喜欢
      • 2014-11-23
      • 2015-03-29
      • 2020-10-28
      • 2022-01-09
      • 2015-10-12
      • 2020-10-13
      • 2018-01-20
      • 2013-12-15
      • 2015-10-12
      相关资源
      最近更新 更多