【发布时间】:2021-10-04 02:42:06
【问题描述】:
我正在尝试从一个使用旧版本 gensim 的示例中学习。特别是,我有一段代码,如:
word_vectors = Word2Vec(vector_size=word_vector_dim, min_count=1)
word_vectors.build_vocab(corpus_iterable)
word_vectors.intersect_word2vec_format(pretrained_dir + 'GoogleNews-vectors-negative300.bin.gz', binary=True)
我的理解是,这会在可用时用预先训练的词向量填充词向量词汇表。当我的词汇表中的单词不在预训练向量中时,它们会被初始化为随机值。但是,最新版本的 gensim 中不存在 intersect_word2vec_format 方法。在 gensim 4.0.0 中复制此过程的最简洁方法是什么?
【问题讨论】: