【发布时间】:2012-09-15 22:54:13
【问题描述】:
我有两个大文件(27k 行和 450k 行)。它们看起来有点像:
File1:
1 2 A 5
3 2 B 7
6 3 C 8
...
File2:
4 2 C 5
7 2 B 7
6 8 B 8
7 7 F 9
...
我想要两个文件中第三列在两个文件中的行(注意带有 A 和 F 的行被排除在外):
OUTPUT:
3 2 B 7
6 3 C 8
4 2 C 5
7 2 B 7
6 8 B 8
最好的方法是什么?
【问题讨论】:
-
最简单的就是扫描一次,提取列,计算交点,然后再次扫描,提取匹配的行。
-
匹配字段是否像示例数据中的单个字符?你能创建一个可以选择值的字符类吗?
标签: algorithm file unix intersection