【发布时间】:2018-03-30 05:28:41
【问题描述】:
大家好,
我开始在 Biopython 中编程,我想知道如何从具有所有特征坐标的基因组 GenBank 文件 (*.gb) 中提取基因序列和蛋白质标识符。
我的想法是创建一个包含蛋白质标识符、基因坐标和基因序列的文本文件。
如果您有任何想法,我将不胜感激。
到目前为止我已经试过了:
for seq_record in seq_record.features:
if seq_record.type == 'CDS':
x=seq_record.qualifiers['protein_id']
i=seq_record.location._start.position
f=seq_record.location._end.position
sq = seq_record.seq
FEAT_LIST.append('START END STRAND ID')
FEAT_LIST.append(str(((i, f), s, x, sq)))
print(FEAT_LIST)
但是,我收到此错误:sq = seq_record.seq AttributeError: 'SeqFeature' object has no attribute 'seq'
感谢您的帮助。
【问题讨论】:
-
欢迎来到 StackOverflow!你试过什么?你看过 [Biopython](www.biopython.org) 教程/wiki 吗?简短的回答是,如果没有任何你想要的东西,那就做一个解析器。