【发布时间】:2017-10-26 04:18:01
【问题描述】:
问题 1)
当我调用 CUDA 驱动 API 时,通常我需要先将上下文(代表 GPU 运行时)推送到当前线程。对于普通的cuMalloc,内存将分配在上下文指定的那个 GPU 上。但是如果我尝试调用cuMallocManaged 来创建统一内存,是否还需要推送 GPU 上下文?
问题 2)
假设我有 2 个 GPU,每个都有 1 GB DRAM。那么我可以分配2 GB的统一内存吗?每个 GPU 占一半?
【问题讨论】:
标签: cuda unified-memory cuda-context