【发布时间】:2019-07-01 00:06:09
【问题描述】:
我正在尝试解析 HMMER 给出的一些结果,并且在 tblout 文件中我能够隔离我想要的匹配项。
尽管如此,如果相同的值只匹配一个配置文件,则会重复多次。
例如,这是一次读取重复 3 次:
SRR6033660.161030 FAM007172 4e-15 4.2e-15 63.4 63.4
SRR6033660.1458607 FAM019859 2.5e-12 2.7e-12 55.0 54.9
SRR6033660.1458607 FAM015326 4e-14 4.2e-14 58.8 58.7
SRR6033660.1458607 FAM000764 7.5e-25 8.1e-25 94.6 94.5
它匹配 3 个家庭,但我只想选择具有最低 e 值的行(第 3 列和第 4 列)
我如何编写一个 awk 命令来给我这个输出?
SRR6033660.161030 FAM007172 4e-15 4.2e-15 63.4 63.4
SRR6033660.1458607 FAM000764 7.5e-25 8.1e-25 94.6 94.5
谢谢!
【问题讨论】:
-
如果您有 A 行和 B 行且 A1==B1 其中 A3>B3 但 B4>A4,您想要什么?
-
edit你的问题,向我们展示你到目前为止所做的尝试。