【问题标题】:Phred qual error after fastq trimming with Cutadapt使用 Cutadapt 进行 fastq 修剪后的 Phred 质量错误
【发布时间】:2020-08-19 12:45:38
【问题描述】:

在使用 bowtie2 映射到基因组之前,我想将 fastq 文件中所有读取的开头修剪给定长度。我用过 Cutadapt:

cutadapt -u 48 -o output.fastq.gz input.fastq.gz

我的 fastq 文件在修剪后是这样的:

gunzip -c output.fastq.gz | head

@NB502143:99:HFF7TAFX2:1:11101:4133:1019 1:N:0:ATCACG
CATGAAAAAGAGCTCATTTTCAGATGCAGGAATTCCTATCCG
+
EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:19790:1020 1:N:0:ATCACG
CATGATCCACTTTTCCACGCGCTTTGACGACCATTTTATAA
+
EEEEE<EEEEEEEEEEEEEEEEE<EE/EEAEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:6327:1020 1:N:0:ATCACG
CATGATCTCAGTAAAGGCATTTGTGGTTGTTAAGTAGCCATT

当我尝试使用 bowtie2 对其进行映射时,我收到以下错误消息:

Saw ASCII character 10 but expected 33-based Phred qual.

如果我映射 input.fastq.gz,我不会收到此错误,所以我怀疑在修剪期间发生了错误,但我不知道是什么! 我用 FastQC 检查了这两个文件,它们都是 Sanger / Illumina 1.9 编码的。

感谢您的帮助。

【问题讨论】:

    标签: mapping trim


    【解决方案1】:

    我也遇到过类似的问题。当我使用cutadapt 时会发生错误,但当我使用另一个工具fastp 修剪时不会发生错误。

    检查生成的修剪后的fastq 文件的完整性显示某些读取没有碱基。 fastq_utils 包中的 fastq_info 之类的工具可以工作。

    如果出现问题,您可能需要在运行 cutadapt 时使用 -m &lt;minimum-length&gt; 标志。这将删除低于指定长度的读数。如果这是问题,那么之后的对齐应该可以工作。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-10
      • 1970-01-01
      • 2019-10-27
      • 2013-03-17
      • 2022-01-13
      相关资源
      最近更新 更多