【问题标题】:Similarity measure using vectors in gensim在 gensim 中使用向量进行相似性度量
【发布时间】:2019-05-16 10:44:25
【问题描述】:

我有一对单词和这些单词的语义类型。我正在尝试使用语义类型来计算这两个词之间的相关性度量,例如:word1=king, type1=man, word2=queen, type2=woman 我们可以使用 gensim word_vectors.most_similar 从“king-man+woman”中获取“queen”。但是,我正在寻找由“king-man+woman”和“queen”表示的向量之间的相似性度量。

我正在寻找上述(或)的解决方案 计算代表“国王男人+女人”的向量的方法(和) 使用 gensim (or) 中的向量值计算两个向量之间的相似度 计算投影权重向量的简单平均值的方法(即国王男人+女人)

【问题讨论】:

    标签: gensim word2vec


    【解决方案1】:

    您应该查看 gensim most_similar() 方法的源代码,该方法用于对此类类比问题提出答案。具体来说,当您尝试...

    sims = wv_model.most_similar(positive=['king', 'woman'], negative=['man'])
    

    ...最佳结果(在经过充分训练的模型中)通常是“女王”或类似的。因此,您可以查看源代码以确切了解它是如何计算wv('king') - wv('man') + wv('woman') 的目标组合的,然后再搜索所有已知向量以找到最接近该目标的向量。见...

    https://github.com/RaRe-Technologies/gensim/blob/5f6b28c538d7509138eb090c41917cb59e4709af/gensim/models/keyedvectors.py#L486

    ...请注意,局部变量 mean 是所提供的 positivenegative 值的组合。

    您可能还会发现其他有用的方法,直接或作为您自己代码的模型,例如distances()...

    https://github.com/RaRe-Technologies/gensim/blob/5f6b28c538d7509138eb090c41917cb59e4709af/gensim/models/keyedvectors.py#L934

    ...或n_similarity()...

    https://github.com/RaRe-Technologies/gensim/blob/5f6b28c538d7509138eb090c41917cb59e4709af/gensim/models/keyedvectors.py#L1005

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-08-03
      • 1970-01-01
      • 2011-05-25
      • 2021-07-25
      • 2021-11-20
      • 1970-01-01
      • 2013-05-27
      相关资源
      最近更新 更多