【发布时间】:2020-08-19 12:45:38
【问题描述】:
在使用 bowtie2 映射到基因组之前,我想将 fastq 文件中所有读取的开头修剪给定长度。我用过 Cutadapt:
cutadapt -u 48 -o output.fastq.gz input.fastq.gz
我的 fastq 文件在修剪后是这样的:
gunzip -c output.fastq.gz | head
@NB502143:99:HFF7TAFX2:1:11101:4133:1019 1:N:0:ATCACG
CATGAAAAAGAGCTCATTTTCAGATGCAGGAATTCCTATCCG
+
EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:19790:1020 1:N:0:ATCACG
CATGATCCACTTTTCCACGCGCTTTGACGACCATTTTATAA
+
EEEEE<EEEEEEEEEEEEEEEEE<EE/EEAEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:6327:1020 1:N:0:ATCACG
CATGATCTCAGTAAAGGCATTTGTGGTTGTTAAGTAGCCATT
当我尝试使用 bowtie2 对其进行映射时,我收到以下错误消息:
Saw ASCII character 10 but expected 33-based Phred qual.
如果我映射 input.fastq.gz,我不会收到此错误,所以我怀疑在修剪期间发生了错误,但我不知道是什么! 我用 FastQC 检查了这两个文件,它们都是 Sanger / Illumina 1.9 编码的。
感谢您的帮助。
【问题讨论】: