【发布时间】:2022-04-22 22:06:25
【问题描述】:
我想制作一个实时应用程序,其中涉及查找二进制掩码的边缘。我需要一些快速的东西,如果可能的话,没有 GPU,它希望每个图像的运行时间低于 0.0005 秒,大小为 (1000,1000)。我将使用以下二进制图像示例,大小为 (1000,1000)。
(要复制的代码:)
import numpy as np
im=np.zeros((1000,1000),dtype=np.uint8)
im[400:600,400:600]=255
第一个快速做事的合乎逻辑的方法是使用 OpenCV 库:
import cv2
timeit.timeit(lambda:cv2.Laplacian(im,cv2.CV_8U),number=100)/100
0.0011617112159729003
正如预期的那样导致: laplacian
我发现这种方式非常耗时。在此之后我尝试了 findContours:
def usingcontours(im):
points=np.transpose(cv2.findContours(im,cv2.RETR_TREE,cv2.CHAIN_APPROX_NONE)[1][0])
tmp=np.zeros_like(im)
tmp[tuple(points)]=255
return tmp
timeit.timeit(lambda:usingcontours(im),number=100)/100
0.0009052801132202148
它给出了与上面相同的结果。 这更好,但仍然没有我想要的那么好。作为最后的手段,我继续使用 numpy 来近似拉普拉斯算子,尽管我知道它会更糟:
def usinggradient(im):
tmp=np.gradient(im)
return ((tmp[0]+tmp[1])>0).astype(np.uint8)
timeit.timeit(lambda:usinggradient(im),number=100)/100
0.018681130409240722
那么,有人对我如何加速算法有任何进一步的想法吗?我强调我希望这个算法用于二值图像,所以我想一定有更好的实现。
【问题讨论】:
-
您可以通过一些 NumPy 和 Scipy 形态侵蚀以及 NumPy 的按位运算来做到这一点。查看
scipy.ndimage.morphology.binary_dilation和np.logical_*函数。 -
1000 x 1000 / 0.0005s = 2 x 10^9 pixels/second-- 每个像素需要 1-2 个时钟周期,即使是矢量化和并行化也没什么用处。 -
@DanMašek 2 x 10^9 像素/秒意味着按位图像 2x10^9 位/秒。假设一个好的程序使用所有内核,我相信这是可能的,在一个 8 核 2GHz CPU 中,假设每个内核有 4 个线程,我每个时钟周期可以处理 32 个像素(位),所以 64*10^9像素/秒 = 1000 x 1000/ 0.00016 秒。所以我要求任何复杂度低于 O(3*n) 的现成实现,我相信这在二进制图像中是可能的。
-
timeit.timeit(lambda:im+1,number=100)/100 给出 8.358001708984375e-05 秒,所以比我想象的要好,我需要一个小于 O(4*n) 的算法) 复杂性
标签: python opencv numpy binary edges