【发布时间】:2017-11-07 10:21:23
【问题描述】:
我从我的代码中获取词向量。例如,
array([ -3.09521449e-04, 2.73033947e-06, 2.15601496e-04, ...,
5.12349070e-04, 5.04256517e-04, 8.16784304e-05], dtype=float32)
现在,我想确定代表 wor2vec genism 中这个词向量的词是什么。
我使用以下代码进行了尝试。但是没有用。
print(model.wv.index2word(kmeans_clustering.cluster_centers_))
请帮帮我。
【问题讨论】:
-
给一个新词,你可能会推断出向量,但我认为你不能反过来......
-
您使用的是哪个 word2vec 实现?无论如何,基本功能应该是在数据库中找到相似的向量。选择最相似的一个,可能距离为 0,然后选择与该向量最相似的单词。
-
@ArneRecknagel 我正在使用 Gensim。我知道如何使用
most_similar获得相似的词。但是我们如何使用词向量来做到这一点?你能告诉我吗? -
老实说我不知道,抱歉。我需要在 API 中搜索正确的命令。
n_similarity将 docvecs 作为输入,这可能是正确的,但我不知道 docvec 是否与词向量相同。
标签: python word2vec gensim word-embedding doc2vec