CPU: i7-8700
GPU: GTX-1050Ti
硬盘:机械
当前我将NVDIA的AppEncCuda已经跑通了,并在其基础上进行了改进。
我在红色箭头处进行了修改,致使tiff可以直接读入NVENC中 ,并且我的灰度图像没有API,所以我以四张为单位,一次性喂了进去(BGRA)。
这是对不同模块测速的结果
结果发现随着图片张数递增(i),读文件大概在0.120ms左右读四张图片,我的合并、一些地址操作0.010ms,而编码一张图像只需要1ms左右,图中有些为0的地方,因为精度最低1ms,所以都是0。gpu利用率5%左右,甚至不到
所以瓶颈在于读