【问题标题】:Handleing gff file from MISA处理来自 MISA 的 gff 文件
【发布时间】:2022-11-16 23:07:46
【问题描述】:

用基序长度替换 BED 文件中的整列

我正在使用 MISA 挖掘 STR,我从 gff 文件中收集数据以制作包含 5 列的 BED 文件。染色体|开始|结束|基序长度|基序。但是第四列显示重复次数example of my BED file

我想将第 4 列替换为基序长度.

for i in perfect.SSR_MISA.bed; do awk '{OFS="\t"} n=$5 q=$(expr length "$n") {print $1, $2, $3, q, $5}' >> perfect.SSR_MISA.bed; sleep 1; done

我试过了但是没用

【问题讨论】:

    标签: bash bioinformatics dna-sequence gff


    【解决方案1】:
    1. 不要使用循环,只使用文件作为参数。 awk 将在行上循环
    2. 你的长度表达式是错误的,见:https://riptutorial.com/awk/example/17378/length--string--
    3. 不要对输入和输出使用相同的文件名。这只会清空您的输入文件
      awk '{OFS="	"} q=length($5) {print $1, $2, $3, q, $5}' perfect.SSR_MISA.bed > perfect.SSR_MISA.result.bed
      

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-04-05
      • 2015-03-15
      • 2016-11-05
      • 1970-01-01
      • 1970-01-01
      • 2018-11-15
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多