【发布时间】:2019-01-25 06:24:46
【问题描述】:
我正在使用 word2vec/doc2vec 来查找两个文档的文本相似性。 我研究了 word2vec 有两种方法:
- CBOW:根据上下文预测单词
- Skipgram:根据单词预测上下文
但我一直在理解这两种方法在计算文本相似度方面的工作原理。 还有哪一个是当前任务的更好方法。
【问题讨论】:
-
您是否已经拥有 word2vector 语料库并且想知道这个向量如何帮助提高相似度,或者您想知道这些向量是如何形成的?
-
我知道向量是如何在提供的窗口大小中形成的。但我在理解这些向量如何用作文本相似性方面遇到了问题
-
看看这个视频,应该会有所帮助youtube.com/watch?v=hjx-zwVdfjc
标签: nlp data-science word2vec