【发布时间】:2018-08-15 06:56:45
【问题描述】:
我训练了一个 gensim Word2Vec 模型。 假设我有一个特定的向量,我想找到它所代表的单词 - 最好的方法是什么?
含义,对于特定的向量:
vec = array([-0.00449447, -0.00310097, 0.02421786, ...], dtype=float32)
我要说一句话:
'computer' = model.vec2word(vec)
【问题讨论】:
-
你得到的不是它所代表的词,而是最相似的词。如果你给它精确的向量表示(距离=0),这些可以是语料库中的词。但是 word2vec 的整个想法是,您可以使用语义/句法距离度量来表示语料库中的单词,该度量由相关单词向量之间的距离表示。
标签: python-3.x nlp gensim word2vec