【发布时间】:2021-05-11 07:12:45
【问题描述】:
我有一个内核,它使用 单流 来感受两个参数(dev_out_1 和 dev_out_2)的数据。我想将数据从设备复制回主机并行。 我的要求是使用单流并并行复制回主机。
您如何处理此类问题?
SomeCudaCall<<<25,34>>>(input, dev_out_1,dev_out_2);
cudaMemcpyAsync(toHere_1, dev_out_1, sizeof(int), cudaMemcpyDeviceToHost,0);
cudaMemcpyAsync(toHere_2, dev_out_2, sizeof(int), cudaMemcpyDeviceToHost,0);
【问题讨论】:
标签: cuda cuda-streams