【问题标题】:Tensorflow Object-detection model training failed on google cloud谷歌云上的 TensorFlow 对象检测模型训练失败
【发布时间】:2017-11-24 03:06:03
【问题描述】:

ERROR 2017-11-23 18:39:51 -0800 service 副本 worker 2 退出 具有非零状态 1。终止原因:错误。

ERROR 2017-11-23 18:39:51 -0800 service Traceback(最近一次调用 最后):

错误 2017-11-23 18:39:51 -0800 服务文件 “/usr/lib/python2.7/runpy.py”,第 162 行,在 _run_module_as_main 错误 2017-11-23 18:39:51 -0800 服务“ma​​in”,fname, 加载程序,pkg_name)

错误 2017-11-23 18:39:51 -0800 服务文件 “/usr/lib/python2.7/runpy.py”,第 72 行,_run_code

错误 2017-11-23 18:39:51 -0800 run_globals中的服务执行代码

错误 2017-11-23 18:39:51 -0800 服务文件 "/root/.local/lib/python2.7/site-packages/object_detection/train.py", 第 49 行,在

错误 2017-11-23 18:39:51 -0800 服务来自 object_detection 导入训练器

错误 2017-11-23 18:39:51 -0800 服务文件“/root/.local/lib/python2.7/site-packages/object_detection/trainer.py”, 第 27 行,在

错误 2017-11-23 18:39:51 -0800 服务来自 object_detection.builders 导入 preprocessor_builder

错误 2017-11-23 18:39:51 -0800 服务文件 "/root/.local/lib/python2.7/site-packages/object_detection/builders/preprocessor_builder.py", 第 21 行,在

错误 2017-11-23 18:39:51 -0800 服务来自 object_detection.protos 导入 preprocessor_pb2

错误 2017-11-23 18:39:51 -0800 服务文件 "/root/.local/lib/python2.7/site-packages/object_detection/protos/preprocessor_pb2.py", 第 71 行,在

ERROR 2017-11-23 18:39:51 -0800 service options=None, file=DESCRIPTOR),

错误 2017-11-23 18:39:51 -0800 service TypeError: new() got an unexpected keyword argument 'file'

使用protobuf (3.5.0.post1)

但是当我在本地运行 taining 时,没有错误!

【问题讨论】:

  • 2017-11-23 18:39:51 -0800 服务文件“/root/.local/lib/python2.7/site-packages/object_detection/protos/preprocessor_pb2.py”,第 71 行,在错误 2017-11-23 18:39:51 -0800 服务选项 = 无,文件 = 描述符)中,错误 2017-11-23 18:39:51 -0800 服务类型错误:新()得到了一个意外的关键字参数'文件'
  • 能否提供一些trainer.py中的代码?

标签: tensorflow object-detection-api


【解决方案1】:

Cloud ML Engine 不支持最新版本的 TensorFlow 或 protobuf。你可以看到当前的包和版本here。您是否将 protobuf 添加到 setup.py 中所需的包列表中?

在 setup.py 中,您可以使用如下代码请求更新版本的 TensorFlow:

REQUIRED_PACKAGES = ['tensorflow>=1.3']
setup(
    ...
    install_requires=REQUIRED_PACKAGES,
    ...
)

【讨论】:

  • 我降级到 tensorflow 1.2。但又出现了一个错误。文件“/root/.local/lib/python2.7/site-packages/object_detection/utils/visualization_utils.py”,第 24 行,在 中,import matplotlib.pyplot as plt,ImportError: No module named matplotlib.pyplot
  • 对。将代码部署到 ML Engine 时无法访问 matplotlib。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-01-22
  • 2018-05-04
  • 2020-02-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-12-11
相关资源
最近更新 更多