【发布时间】:2015-01-09 09:59:54
【问题描述】:
我正在使用 cut 来提取制表符分隔文件中的列:
cut -f 14 glra3res.vcf
这里的结果是:
STRAND=-1;SYMBOL=GLRA3;SYMBOL_SOURCE=HGNC;HGNC_ID=HGNC:4326;BIOTYPE=protein_coding;CANONICAL=YES;CCDS=CCDS54942.1;ENSP=ENSP00000411593;SWISSPROT=P23415;UNIPARC=UPI0000DA6BF2;SIFT=deleterious(0.02);PolyPhen=benign(0.167);EXON=9/9;DOMAINS=Superfamily_domains:SSF90112;HGVSc=ENST00000455880.2:c.1363C>A;HGVSp=ENSP00000411593.2:p.His455Asn;AA_MAF=T:0;EA_MAF=T:0.000116
STRAND=-1;SYMBOL=GLRA3;SYMBOL_SOURCE=HGNC;HGNC_ID=HGNC:4326;BIOTYPE=protein_coding;CCDS=CCDS4320.1;ENSP=ENSP00000274576;SWISSPROT=P23415;TREMBL=Q14C71;UNIPARC=UPI000013DA17;SIFT=deleterious(0.02);PolyPhen=benign(0.315);EXON=9/9;DOMAINS=Superfamily_domains:SSF90112;HGVSc=ENST00000274576.6:c.1339C>A;HGVSp=ENSP00000274576.4:p.His447Asn;AA_MAF=T:0;EA_MAF=T:0.000116
我想提取SYMBOL= 和; 之间的字符串,这将导致GLRA3。
我正在尝试将其通过管道传输到 grep 命令中:
cut -f 14 glra1res.vcf | grep 'SYMBOL='
当然会选择SYMBOL=,我也可以只选择;。我很难将两者结合起来以获得它们之间的字符串。只是在做
cut -f 14 glra1res.vcf | grep 'SYMBOL=' | grep ';'
忽略SYMBOL=,我认为如果我可以同时选择这两个,那将是一个开始......
【问题讨论】: