【问题标题】:Change header of fasta file with sequential numbers用序号更改fasta文件的标题
【发布时间】:2016-06-16 12:21:47
【问题描述】:

如何使用 awk/sed/grep 更改文件中更多 fasta 序列的标题,例如:

>chromosome1|2199-2200
----------------------

>chromosome1|3546-3548
----------------------

>chromosome1|6489-6548
----------------------

到这里:

>chromosome1-1|2199-2200
------------------------

>chromosome1-2|3546-3548
------------------------

>chromosome1-3|6489-6548
------------------------

目前我只能在名称的开头或结尾添加一个序列号,例如:

awk '/^>/{gsub(/^>/,">Seq"i++" ");}1'

>Seq1chromosome1|2199-2200

【问题讨论】:

    标签: bash awk sed gsub fasta


    【解决方案1】:
    $ awk '/>/{sub(/\|/,"-"++i"|")}1' file
    >chromosome1-1|2199-2200
    ----------------------
    
    >chromosome1-2|3546-3548
    ----------------------
    
    >chromosome1-3|6489-6548
    ----------------------
    

    【讨论】:

      猜你喜欢
      • 2017-07-29
      • 1970-01-01
      • 1970-01-01
      • 2016-04-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多