【发布时间】:2018-09-18 04:55:23
【问题描述】:
我想了解在 SLURM 集群中并行使用 bwa 的最佳方式是什么。显然,这将取决于我作为用户的计算限制。
bwa 软件有一个参数“-t”指定线程数。假设我使用bwa mem -t 3 ref.fa sampleA.fq.gz,这意味着 bwa 将作业拆分为三个任务/线程。换句话说,它将一次并行对齐三个读取(我猜)。
现在,如果我想在多个样本和 SLURM 集群中运行此命令,我是否应该像 bwa mem 一样指定任务数,并指定每个任务的 CPU 数(例如 2)?这将是:
sbatch -c 2 -n 3 bwa.sh
bwa.sh 包含的位置:
cat data.info | while read indv; do
bwa mem -t 3 ref.fa sample${indv}.fq.gz
done
你有什么建议吗?或者你能改进/纠正我的推理吗?
【问题讨论】:
标签: parallel-processing slurm genome