【发布时间】:2022-01-09 23:29:35
【问题描述】:
我有一个制表符分隔的表格,如下所示:
chr1 100 110 + 2 3 0 8 6
chr1 150 200 + 1 4 0 2 0
chr1 200 220 + 1 4 2 0 0
chr1 250 260 + 4 2 6 1 3
我想计算第 5-9 列中有多少个零,并将该数字添加到第 10 列:
chr1 100 110 + 2 3 0 8 6 1
chr1 150 200 + 1 4 0 2 0 2
chr1 200 220 + 1 4 2 0 0 2
chr1 250 260 + 4 2 6 1 3 0
最终,目标是仅对那些不超过 4 个零的行(至少 2 列非零)进行子集化。我知道如何用awk 做这个子集,但我不知道如何计算这些列中的零。如果有更简单的方法只要求在第 5-9 列之间至少有两列非零,那将是理想的。
【问题讨论】:
-
您要选择具有两个零的行或添加一个具有零计数的新列?
-
与其发布一些输出然后说
Ultimately, the goal...并描述您想做的不同的事情,而是说明最终目标是什么并提供给定目标的预期输出。还要添加您的代码,以表明您在询问之前已尝试自己解决问题。
标签: awk text-formatting