【发布时间】:2018-11-27 19:00:39
【问题描述】:
我有一个熊猫数据框,其格式与this question 中的格式完全相同,我正在尝试实现相同的结果。就我而言,我正在计算行索引与其对应的列之间的fuzz-ratio。
如果我尝试此代码(基于链接问题的答案)
def get_similarities(x):
return x.index + x.name
test_df = test_df.apply(get_similarities)
行索引和列名的连接是按单元格进行的,正如预期的那样。正如预期的那样,运行 type(test_df) 返回 pandas.core.frame.DataFrame。
但是,如果我像这样使代码适应我的场景
def get_similarities(x):
return fuzz.partial_ratio(x.index, x.name)
test_df = test_df.apply(get_similarities)
它不起作用。我返回的是一个系列,而不是数据框(该函数的返回类型是 int)
我不明白为什么这两个样本的行为不同,也不明白如何修复我的代码,使其返回一个数据框,每个单元格的 fuzzy.ratio 位于该单元格的行索引和列名之间那个细胞。
【问题讨论】:
标签: python pandas dataframe fuzzywuzzy