我的 TensorFlow 运行 cifar10_multi_gpu_train.py 出了什么问题答案

【问题标题】：What's wrong with my TensorFlow run cifar10_multi_gpu_train.py我的 TensorFlow 运行 cifar10_multi_gpu_train.py 出了什么问题
【发布时间】：2016-12-29 03:35:45
【问题描述】：

我的系统是：

Linux dl1 3.10.0-229.el7.x86_64 #1 SMP Fri Mar 6 11:36:42 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

还有我的 GPU：

可以运行 mnist 和 cifar10 单 GPU 版本等示例模型。所以我认为我的 tf 安装没有问题。

但是，当我跑步时：

python python cifar10_multi_gpu_train.py --num_gpus=4

我收到了这个错误：

ValueError: 变量 conv1/weights/ExponentialMovingAverage/ 没有存在，或者不是用 tf.get_variable() 创建的。你的意思是设置在 VarScope 中重用=None？

【问题讨论】：

添加一些代码，但是错误似乎是您在创建变量时设置了参数重用。也可能是 cifar 示例是为旧版本的 tensorflow 完成的，现在由于 api 的更改而失败。尝试使用 tensorflow 0.10

标签： python tensorflow

【解决方案1】：

有代码可以看吗？我个人认为这个问题是因为你没有为不同 gpu 中的不同输入重用 sharing variables，检查这条线 tf.get_variable_scope().reuse_variables() 是否在每个 gpu 的循环中

【讨论】：

你的 tf 版本？
tf 版本为 0.12.head
# 为下一个塔重用变量。 tf.get_variable_scope().reuse_variables()
我找到了你提到的代码，我该如何解决这个问题