【发布时间】:2020-08-22 07:20:46
【问题描述】:
我有多个 CSV 文件,每个 CSV 文件中有两列:
- 链接(A 列)
- 说明(B 列)
我不知道最好的方法是在找到时删除链接和描述的所有重复项,只留下一个,这样就只剩下一个链接和描述的实例。如果我可以一次导入所有 CSV 文件,那将是最好的,一个链接可能会出现在多个 CSV 文件中。链接和描述是否有重复将完全相同。谢谢!
【问题讨论】:
-
这能回答你的问题吗? Python lists, csv, duplication removal
-
如果你不是专门使用 Python,这在 Bash 中很容易做到:cat *.csv |排序 | uniq > deduped.csv
标签: python csv spreadsheet opencsv