【发布时间】:2018-02-26 08:26:17
【问题描述】:
我跟着下一个tutorial 训练物体检测TensorFlow 1.3 模型。我想在 Google 云上使用我的小数据集(1 类,约 100 个示例)重新训练 faster_rcnn_resnet101_coco 或 faster_rcnn_inception_resnet_v2_atrous_coco 模型。我已经更改了一些类和 PATH_TO_BE_CONFIGURED,正如关于相对 config files. 的教程中所建议的那样
数据集:12 张图片,4032 × 3024,每张图片有 10-20 个标记的边界框。
为什么会出现内存不足异常?
副本 master 0 内存不足并以非零状态 247 退出。
请注意我尝试了不同的配置:
- 规模层 BASIC_GPU
- default config yaml
-
自定义 yaml 以使用具有更多内存的实例
trainingInput: runtimeVersion: "1.0" scaleTier: CUSTOM masterType: complex_model_l workerCount: 7 workerType: complex_model_s parameterServerCount: 3 parameterServerType: standard
【问题讨论】:
-
可能是类的数量太多或者你输入的图片太大了。
-
我只有一节课。可能图片太大了? (4032 × 3024)
标签: tensorflow google-cloud-platform tensorflow-gpu