【问题标题】:Given a word vector get the word of it in word2vec给定一个词向量,在 word2vec 中获取它的词
【发布时间】:2017-11-07 10:21:23
【问题描述】:

我从我的代码中获取词向量。例如,

array([ -3.09521449e-04,   2.73033947e-06,   2.15601496e-04, ...,
         5.12349070e-04,   5.04256517e-04,   8.16784304e-05], dtype=float32)

现在,我想确定代表 wor2vec genism 中这个词向量的词是什么。

我使用以下代码进行了尝试。但是没有用。

print(model.wv.index2word(kmeans_clustering.cluster_centers_))

请帮帮我。

【问题讨论】:

  • 给一个新词,你可能会推断出向量,但我认为你不能反过来......
  • 您使用的是哪个 word2vec 实现?无论如何,基本功能应该是在数据库中找到相似的向量。选择最相似的一个,可能距离为 0,然后选择与该向量最相似的单词。
  • @ArneRecknagel 我正在使用 Gensim。我知道如何使用most_similar 获得相似的词。但是我们如何使用词向量来做到这一点?你能告诉我吗?
  • 老实说我不知道​​,抱歉。我需要在 API 中搜索正确的命令。 n_similarity 将 docvecs 作为输入,这可能是正确的,但我不知道 docvec 是否与词向量相同。

标签: python word2vec gensim word-embedding doc2vec


【解决方案1】:

gensim most_similar() 方法也将向量作为参数,但您必须在 positive 示例列表中明确提供它作为一个项目 - 这样它就不会被误解为其他东西。

例如:

wv = model.wv.['book']
similars = model.wv.most_similar(positive=[wv,])

自然,“书”将位于与它自己的向量最相似的单词列表的顶部。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-12-12
    • 2015-01-17
    • 2016-09-05
    • 1970-01-01
    • 2015-10-05
    • 2017-10-09
    • 2019-02-23
    • 2016-10-15
    相关资源
    最近更新 更多