【发布时间】:2016-02-06 22:09:00
【问题描述】:
这与之前提出的问题类似(请参阅下面的链接),但这次我想将常用字符串输出到行而不是列中,如下所示:
我有两个文件,每个文件都有一列,如下所示:
文件 1
chr1 106623434
chr1 106623436
chr1 106623442
chr1 106623468
chr1 10699400
chr1 10699405
chr1 10699408
chr1 10699415
chr1 10699426
chr1 10699448
chr1 110611528
chr1 110611550
chr1 110611552
chr1 110611554
chr1 110611560
文件 2
chr1 1066234
chr1 106994
chr1 1106115
我想搜索文件 1 并提取与文件 2 的第 1 行完全匹配的所有行,并在它自己的行上输出所有匹配项。然后我想对文件 2 的第 2 行做同样的事情,依此类推,直到在文件 1 中找到文件 2 的所有匹配项并输出到它自己的行。此外,我正在处理非常大的文件,因此不需要将文件 2 完全存储在内存中,否则它不会运行完成。希望输出看起来像这样:
chr1 106623434 chr1 106623436 chr1 106623442 chr1 106623468
chr1 10699400 chr1 10699405 chr1 10699408 chr1 10699415 chr1 10699426 chr1 10699448
chr1 110611528 chr1 110611550 chr1 110611552 chr1 110611554 chr1 110611560
类似的问题: How to move all strings in one file that match the lines of another to columns in an output file?
【问题讨论】: