【发布时间】:2017-04-11 20:43:55
【问题描述】:
感谢您的宝贵时间。
nvidia-smi 报告两个 gpus 的相同内存使用情况是否出乎意料甚至是病态的?具体来说,我有一个 2 gpu 系统,并且为两个 gpus 列出的“内存使用”的 numerator 在任何情况下都是相同的。我应该注意其他功能(例如“Temp”)报告为不同。
上下文:我正在尝试调试在尝试限制 tensorflow 程序使用的 gpus 时出现的问题(例如使用 CUDA_VISIBLE_DEVICES)。一个假设是nvidia不知何故无法区分gpus。所有 nvidia/cuda 驱动程序似乎都已正确安装,因为只要使用所有 gpu,gpu 加速程序就可以正常运行。
规格:2 TitanX (Pascal) gpus,z10ped-16 主板。
【问题讨论】:
-
不清楚我为什么要投票结束。如果这个问题不适合 SO,那么要回答的“后备”问题是“我怎样才能以更有建设性的方式提出这个问题以获得更多有用的反馈?”
标签: tensorflow cuda multi-gpu