【发布时间】:2014-03-07 21:55:53
【问题描述】:
我正在尝试使用 NCBIWWW 通过 biopython 运行 blastn。
我在给定的示例文件上使用 qblast 函数。
我定义了一些方法,当我的 fasta 包含足够长的序列时,一切都像魅力一样。唯一失败的情况是当我需要爆炸来自 Illumina 测序的读数太短时。所以我想说这可能是因为提交作品时没有自动重新定义爆破参数。
我尽我所能接近blastn-short条件(参见here中的表C2)但没有任何成功。
看来我无法输入正确的参数。
我认为我越来越接近工作情况是:
result_handle = NCBIWWW.qblast("blastn", "nr",
fastaSequence,
word_size=7,
gapcosts='5 2',
nucl_reward=1,
nucl_penalty='-3',
expect=1000)
感谢您提供任何提示/建议以使其发挥作用。
我的 fasta 阅读示例如下:
>TEST 1-211670
AGACTGCGATCCGAACTGAGAAC
我得到的错误如下:
>ValueError: Error message from NCBI: Message ID#24 Error: Failed to read the Blast query: Protein FASTA provided for nucleotide sequence
当我查看this page 时,似乎我的问题在于修复阈值,但显然到目前为止我还没有成功。
感谢您的帮助。
【问题讨论】:
-
为什么不把这个问题放到 bioinformatics.stackexchange 上?
标签: python biopython blast ncbi