【发布时间】:2017-08-21 20:17:28
【问题描述】:
from gensim.models.keyedvectors import KeyedVectors
model = KeyedVectors.load_word2vec_format('google_news.bin', binary=True)
print(model['the']) # this prints the 300D vector for the word 'the'
代码将 google_news 二进制文件加载到模型中。 我的问题是,第 3 行如何计算二进制文件的输出(因为二进制文件包含 0 和 1)。
【问题讨论】:
-
“二进制”文件有点误导。计算机上的所有文件都以二进制形式存储。
binary=True这里指的是对文件进行序列化,这样电脑就可以直接加载文件,而不需要“解析”特定的格式。见泡菜文档;P
标签: neural-network nlp semantics text-mining word2vec