【发布时间】:2018-03-06 19:04:51
【问题描述】:
我正在尝试逐步从 Brainscript 转移到 cntk 的 C++ 接口。完全缺乏文档并没有帮助。我最新的项目是多 GPU 训练。有一个单 GPU 训练的例子。进行多 GPU 训练的最佳策略是什么。是否有与 python data_parallel_distributed_learner 等效的 c++? (或其他并行化方法)还是您必须自己在低级别(数据选择、模型参数组合等)编写代码。这如何与 MPI 一起工作?线程/OpenMP 是否与评估一样是一个选项(在这种情况下如何选择 GPU/组合分布式模型)。
【问题讨论】: