【发布时间】:2019-10-24 19:26:04
【问题描述】:
我正在尝试计算所有值之间的余弦相似度。
1000*20000 的计算时间花了我 10 多分钟。
代码:
from gensim import matutils
# array_A contains 1,000 TF-IDF values
# array_B contains 20,000 TF-IDF values
for x in array_A:
for y in array_B:
matutils.cossim(x,y)
需要使用gensim包获取tf-idf值和相似度计算。
有人可以给我一些建议和指导以加快时间吗?
【问题讨论】:
-
是否有可能摆脱其中一个 for 循环? Cython 会加快速度吗?
标签: python gensim cosine-similarity