【发布时间】:2016-05-21 07:20:12
【问题描述】:
当我执行一些 cuda 内核时,我注意到对于我自己的许多 cuda 内核,x64 构建会导致失败,而 Win32 不会。
我很困惑,因为 cuda 源代码是相同的,并且构建很好。就在 x64 执行时,它说它需要太多资源来启动。但是从概念上讲,x64 不应该比 Win32 允许更多的资源吗?
如果可能的话,我通常喜欢每个块使用 1024 个线程。因此,要使 x64 代码工作,我必须将块缩小到 256。
有人知道吗?
【问题讨论】:
标签: windows visual-studio cuda gpgpu