【发布时间】:2018-05-03 04:01:45
【问题描述】:
我是 cuda 的新手,我想编写一个 cuda 内核,在给定输入矩阵、卷积(或滤波器)和输出矩阵的情况下计算卷积。
注意:我希望 cuda 内核的每个线程在输出矩阵中计算一个值。
我该怎么做?
【问题讨论】:
-
据我所知,CUDA 网站上有几十个示例。特别是考虑到卷积是一项非常常见的任务这一事实。这种情况是否发生了变化,或者您在那里没有发现任何东西?
-
@CWBudde 谢谢你的评论。是的,我在整个网站上找到了几个带有许多困难案例的长示例,但不幸的是,我还没有找到简单的示例。如果你有的话,我会很高兴的。
标签: cuda nvidia gpgpu convolution