【发布时间】:2016-09-12 12:56:42
【问题描述】:
我目前正在为 DMA 开发 linux 驱动程序。
驱动程序使用dma_alloc_coherent 分配内存区域,我使用_dma_mmap_id = (int*) mmap(NULL, buffer_size, PROT_READ | PROT_WRITE, MAP_SHARED, _dma_device_id, 0); 将其映射到用户空间。在用户空间中,我对该区域进行读写操作并触发 DMA 传输。
但是,我注意到写入映射区域的速度非常慢(~100MB/s)。 因此,我正在寻找加速这一过程的方法。
我尝试分配非连贯内存(使用kmalloc 和dma_alloc_noncoherent)用于测试目的(只是为了看看这是否会加速内存访问),但在这些情况下我无法分配的内存量非常有限(例如,kmalloc 为 4MB),这比我要在单个 DMA 访问中传输的内存量要小。
所以我不确定有哪些可能的替代方案可能会带来更高的性能。
- 是否有可能将数据复制到比
memcpy更快的区域? - 是否可以分配更大的缓存内存区域?使用
dma_alloc_coherent我最多可以分配 64 MB - 为什么这比使用kmalloc可以分配的内存大得多? - 有哪些替代方法?
目前,将数据传输到映射区域是我的应用程序的瓶颈。
最好的问候, 载脂蛋白
【问题讨论】: