【发布时间】:2018-09-20 17:12:43
【问题描述】:
与R recordlinkage identity 类似的问题,但在 python 中。该算法生成的新身份不反映匹配记录的正确身份。假设具有单个数据帧的数据重复。
PS:在data duplication好像还可以 例子
【问题讨论】:
标签: python record-linkage
与R recordlinkage identity 类似的问题,但在 python 中。该算法生成的新身份不反映匹配记录的正确身份。假设具有单个数据帧的数据重复。
PS:在data duplication好像还可以 例子
【问题讨论】:
标签: python record-linkage
使用 pandas 生成的索引列需要删除并替换为数据框中的首选列以用作标识列
逻辑是
replace index column with identify column in dataframe
【讨论】: