【发布时间】:2019-12-27 04:09:37
【问题描述】:
我有以下 Pandas 数据框,需要逐行查找余弦相似度。但我的代码返回一个值矩阵。
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
df = pd.DataFrame({"a" : [[0.1, 0.2],[0.5,0.3,0.3],[0.5]], "b" : [[0.1,0.2],[0.2,0.3,0.4],[0.5]]})
cosine_similarity(df["a"].tolist(), df["b"].tolist())
我需要有一个额外的列和每行的余弦值的输出。
【问题讨论】:
标签: python-3.x cosine-similarity