【问题标题】:"Compile with USE_CUDA=1 to enable GPU usage" Message with MXNet on AWS Deep Learning AMI“使用 USE_CUDA=1 编译以启用 GPU 使用”在 AWS 深度学习 AMI 上使用 MXNet 的消息
【发布时间】:2018-04-06 20:23:39
【问题描述】:

我想在使用 MXNet 的 g2.8xarge EC2 实例上利用所有 4 个 GPU 来训练神经网络。我正在使用以下 AWS Deep Learning Linux 社区 AMI:

深度学习 AMI Amazon Linux - 3.3_Oct2017 - ami-999844e0)

根据这些instructions,当我连接到实例时,我通过发出以下命令切换到带有 MXNet 后端的 keras v1:

source ~/src/anaconda3/bin/activate keras1.2_p2

我还在我的 python 模型编译代码中添加了上下文标志,以利用 MXNet 中的 GPU:

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'], context=gpu_list)

其中 gpu_list 旨在利用所有 4 个 GPU。

但是每次我运行我的代码时,我都会收到以下错误消息:

纪元 1/300 [15:09:52] /home/travis/build/dmlc/mxnet-distro/mxnet-build/dmlc-core/include/dmlc/logging.h:308: [15:09:52] src/storage/storage .cc:113:使用 USE_CUDA=1 编译以启用 GPU 使用

RuntimeError: simple_bind 错误。论据: 密集输入_1:(25、34L) [15:09:52] src/storage/storage.cc:113:使用 USE_CUDA=1 编译以启用 GPU 使用

我检查了 /home/ec2-user/src/mxnet 中的 config.mk 文件,它包含 USE_CUDA=1。我还发出了“made”命令,尝试使用 USE_CUDA=1 标志重新编译 MXNet - 没有变化。

我在使用 AWS 文档要求使用的虚拟环境时是否遇到此问题?使用此虚拟环境的 AWS Deep Learning Ubuntu AMI 上的 MXNet 是否有其他人遇到过这个问题?

任何建议都非常感谢 -

【问题讨论】:

    标签: amazon-web-services machine-learning amazon-ec2 deep-learning mxnet


    【解决方案1】:

    这是因为 Keras Conda 环境对 mxnet cpu pip 包有依赖。您可以在 Conda 环境中安装 gpu 版本:

    pip install mxnet-cu80
    

    【讨论】:

    • 谢谢 :) @hungrypanda
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-07-27
    • 1970-01-01
    • 2020-02-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-09-23
    相关资源
    最近更新 更多