【问题标题】:A CUDA parallel program help needed需要 CUDA 并行程序帮助
【发布时间】:2013-08-24 22:11:12
【问题描述】:

我是 CUDA 和并行编程的新手。我想在 CUDA 中做一个双并行部分,有人可以在这里帮助我。很抱歉在这里发帖,但我有点困惑,找不到任何好的教程或帮助。 我想创建一个函数,使其在 CUDA 中并行工作,然后我想创建另一个从该函数并行调用的 CUDA 函数,在 CUDA 的内核函数中是否可能?

编辑

例如,我有两个内核函数 my_progmy prog_1 我这样称呼它们

main_function
{
    my_prog<<core,threads>>();
}

my_prog()
{
   //here i want to call my_prog_1 in parallel
   my_prog_1<<core,threads>>();
}

【问题讨论】:

    标签: c++ cuda parallel-processing


    【解决方案1】:

    如果您想学习如何编写 CUDA 程序,我建议您学习一些可用的教程。

    NVIDIA 有一个webinar page 提供各种教程。

    对于初学者来说,这两个网络研讨会将为您提供 CUDA 的基本介绍,并提供足够的知识来编写快速运行的 CUDA 程序:

    使用 CUDA C 进行 GPU 计算 - 简介 (2010) 介绍使用 CUDA C 进行 GPU 计算的基础知识。概念将通过代码示例的演练进行说明。无需先前的 GPU 计算经验

    使用 CUDA C 的 GPU 计算 – 高级 1 (2010) 一级优化技术,例如全局内存优化和处理器利用率。将使用真实的代码示例来说明概念

    如果你想学习如何编写 CUDA 程序,花 2 个小时是很划算的。

    编辑: 您在这里描述的是 CUDA 动态并行。它需要 CUDA 计算能力为 3.5(今天)的设备。

    您可以找到完整的用户指南here

    【讨论】:

    • 感谢您的回答,我可以编写一个简单的 CUDA 程序,只是想要一些关于如何编写可以在双精度上进行并行计算的 CUDA 程序的指南。例如,我有一个从该内核函数并行调用的内核函数,我想进一步并行调用另一个内核或设备函数,这可能吗?谢谢
    • 如果您有特定的编码问题,也许您应该展示您编写的代码示例。对于 cc 1.3 或更新的设备,计算 double 数据类型应该不是问题。您可以并行调用 2 个内核,这称为并发执行。这仅在内核相对较小时才有用。
    • 请看编辑,我已经更新对不起之前的误解
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-08-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-04
    相关资源
    最近更新 更多