【发布时间】:2018-12-15 21:17:21
【问题描述】:
我有一个包含数百个多 FASTA 文件的目录。
在每个文件头中遵循相同的命名逻辑,如:
>Bubo_bubo_c5_g1_i1 len=168 path=[174:0-148 24:148-168]
在哪里:
> 是每个标头的开头
Bubo_bubo 是物种名称(与 FASTA 文件的名称相同,此处为:Bubo_bubo.fasta)
c5_g1_i1 是一个序列的规范,所有其他字符都是关于特定序列的附加信息
我想要做的是在特定文件中的每个标题中添加相同的数字,在物种名称和有关该文件的其他信息之间,以获得类似:
>Bubo_bubo_001_c5_g1_i1 len=168 path=[174:0-148 24:148-168]
我希望每个文件的数字都不同。你能帮我解决一下吗?
【问题讨论】:
-
Bubo_bubo对于不同的文件名会有所不同.. 对吧? -
是的@stack0114106,正确!
-
我可以假设在第二个下划线之后,出现了特定的序列部分
-
是的!是这样的
标签: bash awk bioinformatics