【发布时间】:2020-01-26 04:26:11
【问题描述】:
我正在使用 word2vec 模型,但在存储和读取它时遇到问题。
import gensim.models.keyedvectors as w2v
from gensim.models import KeyedVectors
word_vectors = w2v.wv
word_vectors.save(filepath + "Vectors.bin")
m = word2vec.KeyedVectors.load_word2vec_format(filepath + "Vectors.bin", binary=True)
我收到以下错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte
laoding 的工作方式如下:
vectors = KeyedVectors.load(filepath + "Vectors.bin", mmap='r')
但是如果我再打电话
vectors.similar_by_word("cat")
我收到以下错误: 类型错误:** 或 pow() 不支持的操作数类型:'list' 和 'int'
我做错了什么? 如何使用 save_word2vec_format() 函数?
【问题讨论】: