【发布时间】:2017-04-19 18:25:18
【问题描述】:
我正在尝试在 TensorFlow 中构建一个大型 CNN,并打算在多 GPU 系统上运行它。我采用了“塔式”系统并为两个 GPU 拆分批次,同时将变量和其他计算保留在 CPU 上。我的系统有 32GB 内存,但是当我运行代码时出现错误:
E tensorflow/stream_executor/cuda/cuda_driver.cc:924] failed to alloc 17179869184 bytes on host: CUDA_ERROR_OUT_OF_MEMORY
W ./tensorflow/core/common_runtime/gpu/pool_allocator.h:195] could not allocate pinned host memory of size: 17179869184
Killed
我已经看到,如果我将 CUDA 设备隐藏到 TensorFlow,代码可以工作(尽管非常缓慢),因此它不使用 cudaMallocHost()...
感谢您的宝贵时间。
【问题讨论】:
标签: tensorflow