【发布时间】:2020-06-29 03:22:26
【问题描述】:
我有一个这样的 fasta 文件:
>rna-XM_00001.1
actact
>rna-XM_00002.1
atcatc
如何删除“rna-”使其变为
>XM_00001.1
actact
>XM_00002.1
atcatc
【问题讨论】:
我有一个这样的 fasta 文件:
>rna-XM_00001.1
actact
>rna-XM_00002.1
atcatc
如何删除“rna-”使其变为
>XM_00001.1
actact
>XM_00002.1
atcatc
【问题讨论】:
您显示的是文件内容?那么 sed 应该可以做到这一点:
sed 's/^>rna-/>/' < inputfile > outputfile
解释:
s,它告诉 sed 进行替换/ 是分隔符^ 告诉 sed 只查看行首>rna- 是匹配行首的模式> 是替换模式的替换如果您希望始终删除 > 之后的前四个字符,只要它们以 - 结尾,您可以使用:
sed 's/^>...-/>/' < inputfile > outputfile
解释:
>...-。该模式是一个正则表达式,其中 . 匹配任何单个字符。所以这个模式匹配任何以>开头的行,后跟任意三个字符,然后是-。【讨论】: