【发布时间】:2014-04-15 02:54:31
【问题描述】:
我正在尝试实现多通道积分图像算法,但速度太慢(Core 2 Quad 上 200 张图像(640x480)需要 8 秒)。我预计 200 张图像的时间为 1 秒。
这是分析结果(超过 200 张图像,n_bins=8):
如何优化*ps = *psu + s?
【问题讨论】:
-
是用最高优化设置编译的吗?
-
@Tyler 是的,它是用 /O2 选项编译的(最大化速度)。
-
你能发布程序集吗?我想知道编译器做了多少矢量化处理。
-
@Tyler pastebin.com/m66rtk5S,谢谢。
-
@Tyler:SSE 不支持水平前缀和。模拟它不会提供任何加速。可以有效地实现垂直前缀和。在积分图像的情况下,只有部分算法可以向量化,并且需要编译器无法发明的转换。
标签: c++ optimization image-processing profiling computer-vision