【发布时间】:2011-05-05 10:06:51
【问题描述】:
我正在研究 HOG 描述符,除了检测窗口的融合之外,我已经完成了大部分工作。
到目前为止,我所做的是;我构建了图像的尺度空间金字塔,对于每个尺度上的每个图像,我移动检测窗口(64x128)并检测人类。在每张图像中,一个人被多个窗口检测到。
所以问题是如何将所有这些窗口(假设为一个人)融合到一个窗口中。 Dalal 建议应该使用稳健的模检测算法,例如均值偏移。但是,我有多个尺度……我是否应该首先估计在尺度空间的较低级别中找到的检测窗口的真实位置才能做到这一点?
感谢任何帮助。 提前致谢。
【问题讨论】:
标签: image-processing computer-vision object-detection