OutputBitmap.SetPixel(object_point_x, object_point_y, InputBitmap0.GetPixel(x, y))
花了一些时间,但我终于破案了。
我们有两个Bitmap:一个用于输出OutputBitmap,另一个用于输入InputBitmap0
让我们把这个任务分成几部分:
- 为
x做InputBitmap0.GetPixel(),y坐标
- 然后,
OutputBitmap.SetPixel() 用于不同的坐标object_point_x, object_point_y
Cudafy 不支持 Bitmap 或 Color 类型的数据。所以我将位图转换为byte 类型。
BitmapData InputBitmapData0 = InputBitmap0.LockBits(new Rectangle(0, 0, InputBitmap0.Width, InputBitmap0.Height), ImageLockMode.ReadOnly, PixelFormat.Format32bppArgb);
IntPtr ptr0 = InputBitmapData0.Scan0;//pointer for color
int stride0 = InputBitmapData0.Stride;
byte[] input_ragba_color = new byte[InputBitmapData0.Stride * InputBitmap0.Height];
Marshal.Copy(ptr0, input_ragba_color, 0, bytes0);// Copy the RGB values of color value into the array.
我们已将InputBitmap0 的内容复制到rgbValues 数组中。现在我们需要做GetPixel()的工作(获取R、G、B、A的值)。
我们还需要为OutputBitmap 执行上述工作(制作数组),因为我们将在 GPU 中执行SetPixel(),但稍后我们会将数组复制回位图。
BitmapData OutputBitmapData = OutputBitmap.LockBits(new Rectangle(0, 0, OutputBitmap.Width, OutputBitmap.Height), ImageLockMode.WriteOnly, OutputBitmap.PixelFormat);
IntPtr ptr_output = OutputBitmapData.Scan0;
byte[] output_ragba = new byte[OutputBitmapData.Stride * OutputBitmap.Height];
它的 GPU 计算时间。让我们初始化 gpu。
CudafyModule km = new CudafyTranslator.Cudafy();
GPGPU gpu = new CudafyHost.getDevice(CudafyModes.Target, CudafyModes.DeviceId);
gpu.LoadModule(km);
现在将input_ragba_color 和output_ragba 发送到gpu,因为我们可以迭代数组并进行任何计算。
byte[] dev_output_rgba_color = gpu.Allocate<byte>(output_ragba.Length);
byte[] dev_input_ragba_color = gpu.CopyToDevice(input_ragba_color);
gpu.Launch(N, 1).update_bitmap(x, y, object_point_x, object_point_y,int stride0, int OutputBitmapData.Stride,dev_input_ragba_color,dev_output_rgba_color);
现在在 GPU(内核)中
[Cudafy]
public static void update_bitmap(GThread thread, int x,int y,int object_point_x,int object_point_y,int stride0, int OutputBitmapData_Stride,byte [] dev_input_ragba_color,byte [] dev_output_rgba_color)
{
dev_output_rgba_color[(object_point_y * OutputBitmapData_Stride) + (object_point_x * 4)] = input_ragba_color[(y * stride0) + (x * 4)];
dev_output_rgba_color[(object_point_y * OutputBitmapData_Stride) + (object_point_x * 4) + 1] = input_ragba_color[(y * stride0) + (x * 4) + 1];
dev_output_rgba_color[(object_point_y * OutputBitmapData_Stride) + (object_point_x * 4) + 2] = input_ragba_color[(y * stride0) + (x * 4) + 2];
dev_output_rgba_color[(object_point_y * OutputBitmapData_Stride) + (object_point_x * 4) + 3] = input_ragba_color[(y * stride0) + (x * 4) + 3];
}
我正在获取每个 R、G、B、A 的值,例如:input_ragba_color[(y *
stride0) + (x * 4) + 1] 正在解决第一个任务
(InputBitmap0.GetPixel())
dev_output_rgba_color 采用input_ragba_color 的值
示例:
dev_output_rgba_color[(object_point_y * OutputBitmapData_Stride) + (object_point_x * 4)] = input_ragba_color[(y * stride0) + (x * 4)];
这解决了我们的第二个任务 (OutputBitmap.SetPixel())
我们现在知道 gpu 已经为我们的 OutputBitmap 填充了一个数组 (dev_output_rgba_color)。
gpu.CopyFromDevice(dev_output_rgba_color, output_ragba); //dev_output_rgba_color values will be assigned to output_ragba
gpu.FreeAll();
使用内存指针将结果复制回OutputBitmap,然后将其从内存中解锁。
Marshal.Copy(output_ragba, 0, ptr_output, output_bytes);// Copy the RGB values of color value into the array.
OutputBitmap.UnlockBits(OutputBitmapData);
现在OutputBitmap 包含更新后的值。