给定一个词向量，在 word2vec 中获取它的词答案

【问题标题】：Given a word vector get the word of it in word2vec给定一个词向量，在 word2vec 中获取它的词
【发布时间】：2017-11-07 10:21:23
【问题描述】：

我从我的代码中获取词向量。例如，

array([ -3.09521449e-04,   2.73033947e-06,   2.15601496e-04, ...,
         5.12349070e-04,   5.04256517e-04,   8.16784304e-05], dtype=float32)

现在，我想确定代表 wor2vec genism 中这个词向量的词是什么。

我使用以下代码进行了尝试。但是没有用。

print(model.wv.index2word(kmeans_clustering.cluster_centers_))

请帮帮我。

【问题讨论】：

给一个新词，你可能会推断出向量，但我认为你不能反过来......
您使用的是哪个 word2vec 实现？无论如何，基本功能应该是在数据库中找到相似的向量。选择最相似的一个，可能距离为 0，然后选择与该向量最相似的单词。
@ArneRecknagel 我正在使用 Gensim。我知道如何使用most_similar 获得相似的词。但是我们如何使用词向量来做到这一点？你能告诉我吗？
老实说我不知道，抱歉。我需要在 API 中搜索正确的命令。 n_similarity 将 docvecs 作为输入，这可能是正确的，但我不知道 docvec 是否与词向量相同。

【解决方案1】：

gensim most_similar() 方法也将向量作为参数，但您必须在 positive 示例列表中明确提供它作为一个项目 - 这样它就不会被误解为其他东西。

例如：

wv = model.wv.['book']
similars = model.wv.most_similar(positive=[wv,])

自然，“书”将位于与它自己的向量最相似的单词列表的顶部。

【讨论】：