【发布时间】:2017-07-21 17:19:59
【问题描述】:
我确实使用 Doc2Vec 在我的语料库上记录了相似性,但它输出的相似性不是很好。我想知道我是否可以从 Doc2Vec 给我的东西做一个主题模型来提高我的模型的准确性以获得更好的相似性?
【问题讨论】:
标签: nlp gensim lda topic-modeling doc2vec
我确实使用 Doc2Vec 在我的语料库上记录了相似性,但它输出的相似性不是很好。我想知道我是否可以从 Doc2Vec 给我的东西做一个主题模型来提高我的模型的准确性以获得更好的相似性?
【问题讨论】:
标签: nlp gensim lda topic-modeling doc2vec
您应该从原始语料库训练一个新模型(如 LDA)。
如果 Doc2Vec 流程提供的本机相似性不是很好,也许您可以通过调整流程来改进它们。
但如果这不起作用,那么 Doc2Vec 并没有从您的数据中提取有用的信息——基于这些(坏)原始数字的下游计算不可能神奇地变得更好。
【讨论】: