【发布时间】:2015-09-20 19:13:13
【问题描述】:
我有一个如下所示的文件:
>sequence_name_16hj51
CAACCTTGGCCAT
>sequence_name_158ghni52
AATTGGCCTTGGA
>sequence_name_468rth
AAGGTTCCA
我想获得这个:
['CAACCTTGGCCAT', 'AATTGGCCTTGGA', 'AAGGTTCCA']
我有一个列表,其中包含标题为title_finder 的所有序列名称。当我尝试使用时:
for i in range(0,len(title_finder)):
seq = seq.split(title_finder[i])
print seq
我得到了这个回溯:
Traceback (most recent call last):
File "D:/Desktop/Python/consensus new.py", line 23, in <module>
seq = seq.split(title_finder[i])
AttributeError: 'list' object has no attribute 'split'
有人可以帮帮我吗?
编辑:有时某些序列跨越多行,因此当我使用 for 循环执行此操作时会得到多个字符串。
【问题讨论】:
-
只能拆分一个字符串,得到一个列表。你的循环反复分裂,所以你在第一次循环后就失败了。
-
使用 BioPython stackoverflow.com/questions/31265282/…
标签: python string split sequence bioinformatics