【问题标题】:Python recordlinkage identityPython 记录链接标识
【发布时间】:2018-09-20 17:12:43
【问题描述】:

R recordlinkage identity 类似的问题,但在 python 中。该算法生成的新身份不反映匹配记录的正确身份。假设具有单个数据帧的数据重复。

PS:data duplication好像还可以 例子

【问题讨论】:

    标签: python record-linkage


    【解决方案1】:

    使用 pandas 生成的索引列需要删除并替换为数据框中的首选列以用作标识列

    逻辑是

    replace index column with identify column in dataframe
    

    【讨论】:

      猜你喜欢
      • 2018-11-03
      • 1970-01-01
      • 2013-01-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-02-28
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多