【发布时间】:2016-01-14 18:41:16
【问题描述】:
我有一个要分析的序列文件,其中包含许多行,例如以下制表符分隔行:
chr12 3356475 . C A 76.508 . AB=0;ABP=0;AC=2;AF=1;AN=2;AO=3;CIGAR=1X;DP=3;DPB=3;DPRA=0;EPP=9.52472;EPPR=0;GTI=0;LEN=1;MEANALT=1;MQM=60;MQMR=0;NS=1;NUMALT=1;ODDS=8.76405;PAIRED=0;PAIREDR=0;PAO=0;PQA=0;PQR=0;PRO=0;QA=111;QR=0;RO=0;RPP=9.52472;RPPR=0;RUN=1;SAF=3;SAP=9.52472;SAR=0;SRF=0;SRP=0;SRR=0;TYPE=snp GT:DP:RO:QR:AO:QA:GL 1/1:3:0:0:3:111:-10,-0.90309,0
我正在尝试使用 awk 将特定区域与其 DP 值匹配。这就是我正在尝试的方式:
awk '$2 == 33564.. { match(DP=) }' file.txt | head
匹配和通配符似乎都不起作用。
理想情况下,此代码将输出 3,因为这就是 DP 的含义。
【问题讨论】: