【发布时间】:2013-11-19 03:01:10
【问题描述】:
我想使用 100 个 DNA 序列创建一个 1000 个随机组。我有包含 100 个 fasta 序列的文本文件 (sequence.txt),我希望随机选择包含 10 个 fasta 序列的子组以进行进一步分析。这是我尝试过的代码,但我遇到了一些错误。
import random
import re
f = open("sequence.txt", "r")
lf = f.split(">")
lf.pop(0)
f.close()
for i in range(10):
sublist = "subset_%s.fas" % i
random_group = random.randrange(len("sequence.txt"), 10)
output = open(sublist, "w")
for m in random_group:
sequence = ">" + lf[m]
output.write(sequence)
output.close()
【问题讨论】:
标签: python bioinformatics