【发布时间】:2019-06-13 01:24:52
【问题描述】:
我想弄清楚氨基酸的第一个字母是否与其字母代码相同。
例如,甘氨酸以 G 开头,其字母代码也是 (G) 另一方面,精氨酸以 A 开头,但其字母代码为 (R)
我正在尝试打印出具有相同字母代码和起始字母的氨基酸。
我有一个 CSV 数据文件,其中的列由 ',' 分隔
Name,One letter code,Three letter code,Hydropathy,Charge,Abundance,DNA codon(s)
Arginine,R,Arg,hydrophilic,+,0.0514,CGT-CGC-CGA-CGG-AGA-AGG
Asparagine,N,Asn,hydrophilic,N,0.0447,AAT-AAC
Aspartate,D,Asp,hydrophilic,-,0.0528,GAT-GAC
Glutamate,E,Glu,hydrophilic,-,0.0635,GAA-GAG
Glutamine,Q,Gln,hydrophilic,N,0.0399,CAA-CAG
Lysine,K,Lys,hydrophilic,+,0.0593,AAA-AAG
Serine,S,Ser,hydrophilic,N,0.0715,TCT-TCC-TCA-TCG-AGT-AGC
Threonine,T,Thr,hydrophilic,N,0.0569,ACT-ACC-ACA-ACG
我相信下面的代码是比较列的一种方法,但我想知道如何从第一列中提取第一个字母并将其与第二列中的字母进行比较
awk '{ if ($1 == $2) { print $1; } }' < foo.txt
【问题讨论】: