【发布时间】:2013-06-25 00:28:07
【问题描述】:
我目前正在编写一个使用 Blast 的 -outfmt 10 选项的库,它为您提供 CSV 而不是人类可读的格式。
喜欢
tblastn -db dmel_a -query somequery.faa -outfmt 10
问题是,我想访问 db 源文件,以便在处理后提取一些序列。我知道如何做到这一点的唯一方法是使用删除 -outfmt 10 并运行两次爆炸。然后我解析人类可读的输出,显示以下内容:
Database: Source.fas
但是,只有在 makeblastdb 中创建数据库时未指定 title 时才有效。无论如何,outfmt 10 的 stitle 似乎是 fasta 标题行。我不能只查找数据库名称,然后查找 .fna, .fas, .faa,因为您可以将数据库命名为与源文件不同的名称。
还有其他方法可以从blast 数据库名称中提取fasta 源文件吗?我在outfmt 选项列表中没有看到一个。还是我今天瞎了?
【问题讨论】:
-
这个问题最好在这里问:biostars.org - 它更有可能得到答案。
标签: bioinformatics blast