【问题标题】:What's wrong with my TensorFlow run cifar10_multi_gpu_train.py我的 TensorFlow 运行 cifar10_multi_gpu_train.py 出了什么问题
【发布时间】:2016-12-29 03:35:45
【问题描述】:

我的系统是:

Linux dl1 3.10.0-229.el7.x86_64 #1 SMP Fri Mar 6 11:36:42 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux

还有我的 GPU:

可以运行 mnistcifar10 单 GPU 版本等示例模型。 所以我认为我的 tf 安装没有问题。

但是,当我跑步时:

python python cifar10_multi_gpu_train.py --num_gpus=4

我收到了这个错误:

ValueError: 变量 conv1/weights/ExponentialMovingAverage/ 没有 存在,或者不是用 tf.get_variable() 创建的。你的意思是设置 在 VarScope 中重用=None?

【问题讨论】:

  • 添加一些代码,但是错误似乎是您在创建变量时设置了参数重用。也可能是 cifar 示例是为旧版本的 tensorflow 完成的,现在由于 api 的更改而失败。尝试使用 tensorflow 0.10

标签: python tensorflow


【解决方案1】:

有代码可以看吗? 我个人认为这个问题是因为你没有为不同 gpu 中的不同输入重用 sharing variables,检查这条线 tf.get_variable_scope().reuse_variables() 是否在每个 gpu 的循环中

【讨论】:

  • 你的 tf 版本?
  • tf 版本为 0.12.head
  • # 为下一个塔重用变量。 tf.get_variable_scope().reuse_variables()
  • 我找到了你提到的代码,我该如何解决这个问题
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2016-02-08
  • 2013-11-16
  • 2021-07-15
  • 2012-10-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多