【发布时间】:2015-04-30 05:15:12
【问题描述】:
我是 CUDA 编程的新手。现在,我有一个问题要处理:我正在尝试使用 CUDA 并行编程来处理一组数据集。对于每个数据集,都需要进行一些矩阵计算。
我的设计是这样的:
启动N个线程来处理每个数据集,因为它们彼此独立,并且处理它们的方法相同。
在 1 中的每个线程中,我想使用一个新函数,这个函数也像内核一样工作,因为它们是矩阵计算...例如调用M个线程并行处理矩阵计算..
有人知道这是否可能吗?
【问题讨论】:
标签: cuda