【发布时间】:2017-06-26 13:43:12
【问题描述】:
我有两个文件。文件 1 有 3000 行(1500 个 ID),文件 2 有 1400 行(700 个 ID)。文件 1 包含文件 2 中存在的所有 id。我必须匹配 File1 和 File 2 的 ID 列,同时保持 id 的顺序。如果文件 2 中的 id 存在于文件 1 中,则比较第 2 列并打印匹配或不匹配。抓住是否有重复的 ID,我需要保留它们。寻找 awk 或 sed 解决方案。谢谢!
File1
ID A
1 13
1 14
2 13
2 13
3 13
3 12
4 13
4 14
5 14
5 14
File 2
ID A
2 13
2 13
3 13
3 3
5 14
5 15
Desired output
ID A
2 13 Match
2 13 Match
3 13 Match
3 3 mismatch
5 14 Match
5 15 mismatch
【问题讨论】:
-
为什么
5 14 mismatch显示在输出中? “5 14”确实出现在文件 1 中 -
在文件 1 中第一次出现 5 的值为 14,而文件 2 中第一次出现 5 的值不是 14(它是 15),因此不匹配。因此,文件 1 中第一次出现的 id 与文件 2 中第一次出现的相同 id 匹配,文件 1 中第二次出现的 id 与文件 2 中第二次出现的 id 匹配
-
发布的答案是否符合您的要求。你应该在这里给一些反馈。
标签: awk