【发布时间】:2018-09-21 22:48:54
【问题描述】:
我正在运行来自 PHYLIP (http://evolution.genetics.washington.edu/phylip/doc/dnadist.html) 的名为 dnadist 的程序。这会根据您输入的序列数创建一个 dna 距离矩阵。
目前,我想从 14,778 个序列创建一个矩阵。我提交此文件以在我大学的 HPCC 上运行,根据我计算的估计,运行需要 10 天。
我想请求更多的内核来加快时间,但我对这是否可以拆分运行的算法感到困惑?还是必须全部在 1 个核心上运行?我的假设是我必须更改算法本身以溢出正在生成的矩阵,然后将它们全部连接在一起。这是正确的假设吗?
【问题讨论】:
-
距离矩阵计算应该是相当简单的并行计算:例如对于三个元素 A、B、C,AB、BC 和 AC 可以各自独立计算。但是,不确定这是否在
dnadist中实现。您可能想查看其他距离矩阵计算工具,例如R(stats::dist函数)中的其他距离矩阵计算工具,或者它们可能也存在于C或 C 衍生物中。 -
你有哪个 HPCC 版本?
标签: phylogeny cpu-cores distance-matrix hpcc hpcc-ecl