【问题标题】:Can I call CUDA runtime function from C++ code not compiled by nvcc?我可以从非 nvcc 编译的 C++ 代码中调用 CUDA 运行时函数吗?
【发布时间】:2011-04-18 05:07:37
【问题描述】:

有什么方法可以调用 CUDA 运行时函数调用,例如

cudaMemcpy(...);

在 .cpp 文件中,使用常规 C++ 编译器编译?

【问题讨论】:

  • 继 Preet 的回答之后:您还需要链接到 cudart 以满足链接器的要求。 IE。 nvcc -lcudart myfile.cpp
  • 你为什么不试试呢? :) 是的,这个特定的函数 cudaMemcpy() 可以从 C 文件中调用。顺便说一句,我发现 cuda 文档在那种细节上很糟糕。

标签: c++ cuda compatibility


【解决方案1】:

编辑:有一个example here,但它不再被发现,但大部分示例都复制在下面。

调用者 C(但可能是 C++)

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <cuda.h>

extern void kernel_wrapper(int *a, int *b);

int main(int argc, char *argv[])
{
   int a = 2;
   int b = 3;

   kernel_wrapper(&a, &b);

   return 0;
}

被调用者 (CUDA)

__global__ void kernel(int *a, int *b)
{
   int tx = threadIdx.x;

   switch( tx )
   {
case 0:
    *a = *a + 10;
    break;
case 1:
    *b = *b + 3;
    break;
default:
    break;
   }
}

void kernel_wrapper(int *a, int *b)
{
   int *d_1, *d_2;
   dim3 threads( 2, 1 );
   dim3 blocks( 1, 1 );

   cudaMalloc( (void **)&d_1, sizeof(int) );
   cudaMalloc( (void **)&d_2, sizeof(int) );

   cudaMemcpy( d_1, a, sizeof(int), cudaMemcpyHostToDevice );
   cudaMemcpy( d_2, b, sizeof(int), cudaMemcpyHostToDevice );

   kernel<<< blocks, threads >>>( a, b );

   cudaMemcpy( a, d_1, sizeof(int), cudaMemcpyDeviceToHost );
   cudaMemcpy( b, d_2, sizeof(int), cudaMemcpyDeviceToHost );

   cudaFree(d_1);
   cudaFree(d_2);
}

【讨论】:

  • 附带说明 - Cuda 不建议像您在提供的内核函数中那样使用发散线程。
  • 请随时编辑答案以使其更好。
【解决方案2】:

你可以使用

g++ I/usr/local/cuda/include filename.cpp -o obj -L/usr/local/cuda/lib64 -lcudart

用于编译或

nvcc filename.cu

【讨论】:

    猜你喜欢
    • 2023-03-10
    • 1970-01-01
    • 1970-01-01
    • 2012-04-19
    • 2012-09-13
    • 2021-12-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多