【问题标题】:Is there any standard process for 16s rRNA analysis?16s rRNA分析有标准流程吗?
【发布时间】:2020-07-14 23:01:25
【问题描述】:

我正在尝试重现 this paper 的树状图结果,涉及特定的 16s rRNA 分析。

但我不知道是否有数据管理或数据分析的标准方法。所以,我一直在自己尝试。下面是一个总结。

在方法部分中说:“生成的 FASTQ 文件存放在 https://www.ncbi.nlm.nih.gov/bioproject/PRJNA386442。MiSeq 双端原始序列正向和反向读取随后使用 ea-utils v1.1.2 与标准设置合并,然后是拆分库从 QIIME v1.9.1 开始,删除序列读取少于 200 个核苷酸、包含不明确碱基的读取或平均质量得分低于 30 的读取。"

所以,我使用 SRATOOLKIT 下载了 sra 文件并在终端使用了这段代码:

for n in {141..188}; do prefetch "SRR5577$n"; done

后来,我使用以下方法转换为 fastq 文件:

for n in {141..188}; do fastq-dump "SRR5577$n"; done

但是,对于合并步骤,我不能使用 fastq-join 函数或 github 上 ea-utils 包中的任何其他函数。数据似乎没有正确的格式。

我做得好吗?在哪里可以了解有关此类分析的更多信息?

【问题讨论】:

    标签: bioinformatics biopython qiime


    【解决方案1】:

    我建议在 fastq-dump 中使用 --split-files,例如:

    for n in {141..188}; do fastq-dump --split-files "SRR5577$n"; done
    

    看起来数据是双端的。否则你不需要合并它们。它会给你单独的正向和反向读取文件,大概你输入到 ea-utils。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-05-15
      • 1970-01-01
      • 1970-01-01
      • 2019-05-06
      • 1970-01-01
      相关资源
      最近更新 更多