【发布时间】:2016-10-18 16:11:18
【问题描述】:
我有两个在 Google Cloud ML 上训练的模型版本,一个使用 2 个工作人员,一个只使用主节点。然而,在分布式模式下训练后召回率显着下降。我遵循了为大约 2000 个步骤提供的示例示例(worker 和 master 都参与了这些步骤)
只有大师
RECALL metrics: 0.352357320099
Accuracy over the validation set: 0.737576772753
Master和2个Worker
RECALL metrics: 0.0223325062035
Accuracy over the validation set: 0.770519262982
【问题讨论】:
标签: tensorflow google-cloud-ml