【发布时间】:2012-05-10 19:01:50
【问题描述】:
我将CUDA GPU计算SDK和CUDA计算工具包升级到4.1。我正在测试 simpleStreams 程序,但始终需要比非流式执行更多的时间。我的设备具有计算能力 2.1,我使用的是 VS2008,Windows 操作系统。
【问题讨论】:
-
Windows 7 和 CUDA 驱动程序是目前在现场提供的一种
-
我确认 Windows 是问题的一部分 - 虽然我暂时无法解释原因。我的桌面上并排安装了 Win8 32 位和 Ubuntu 12.04 32 位,带有 2 个 GPU(8800GTS 和 GTX660)。该示例在 Ubuntu 上完美运行(跟踪显示 memCopy 和内核之间有明显的重叠),而它们在 Win8 上无法重叠。
标签: cuda