【发布时间】:2015-03-20 20:46:26
【问题描述】:
我正在尝试编写一个代码,该代码将打开一个 fasta 文件并从不同的 fastq 文件中提取读取名称 (title)、序列 (seq) 和质量分数 (qual),前提是在 fasta 文件中找到它,并将该 fastq 信息写入一个新的 fastq 文件。但是,我在如何编写最后一部分时遇到了麻烦(我在代码中遇到问题的地方加粗了)。可能有人知道如何编写这部分,或者我在哪里可以找到有关如何在 python 中输入的信息?
到目前为止,我有:
from sys import argv
from Bio.SeqIO.QualityIO import FastqGeneralIterator
script, merged_seqs, raw_seqs = argv
merged_from_raw = "merged_only.fastq"
merged_names = set()
for line in open(merged_seqs):
if line[0] == ">":
read_name = line.split()[0][1:]
merged_names.add(read_name)
raw_fastq = raw_seqs
temp_handle = open(merged_from_raw, "w")
for title, seq, qual in FastqGeneralIterator(open(raw_fastq)) :
if title in merged_names:
**handle.write() #this is where I don't know how to write what I need in python**
【问题讨论】: