【发布时间】:2014-01-16 13:33:56
【问题描述】:
我正在使用 OpenRefine(以前是 Google Refine)清理来自多个来源的数据。我有来自不同来源的包含公司的文件,列定义是相同的,即
统一标识 |姓名 |街道 |城市 |国家 |电话 | ... SG52D |公司a |一条街|一座城市| c国| 12345 SG52D |公司a |一条街|一座城市| c国| 0099835 dfnsd | B公司| B 街 | B市| c国| 33445 dfnsd | B公司|不一样 |另一个 | c国| 33445 xxbb3 | C公司| C街| B市| A 国 | 1111 xxbb3 | C公司| C街| B市| A 国 | 1111我想要的是这个结果(只合并了最后一个公司,所有列都相同)
统一标识 |姓名 |街道 |城市 |国家 |电话 | ... SG52D |公司a |一条街|一座城市| c国| 12345 SG52D |公司a |一条街|一座城市| c国| 0099835 dfnsd | B公司| B 街 | B市| c国| 33445 dfnsd | B公司|不一样 |另一个 | c国| 33445 xxbb3 | C公司| C街| B市| A 国 | 1111有没有简单的方法来做到这一点?
我知道我可以将所有列连接成一个新列,但这是一个小 PITA,因为列的数量。
也许有一种方法可以让新列定义循环遍历所有其他列并将其合并?
【问题讨论】:
标签: openrefine