【发布时间】:2013-07-30 17:22:00
【问题描述】:
我有File1 和File2 如下。我发现了类似的问题,但并不完全相同。
使用File1 行作为grep 的输入并提取File2 的第一列。在下面的玩具示例中,如果 File2 中的 column2 等于 a 或 b,则将 1 写入 File_ab。
到目前为止,我使用的是双循环,估计时间是 4 天。我希望得到类似的东西:cat File1 | xargs -P 12 -exec grep "$1\|$2" File2 > File_$1$2.txt
但未能正确使用语法。我正在尝试与OR 条件并行运行 12 个greps。
File1
a b
c d
File2
1 a
2 b
3 c
1 d
4 a
5 e
6 d
想要的输出是 2 个文件,File_ab 和 File_cd:
File_ab
1
2
4
File_cd
1
3
6
注意:我的File1 是 25K 行,File2 是 10Mln 行。
【问题讨论】:
标签: parallel-processing grep xargs hpc