多尺度定向梯度直方图（均值偏移？）答案

【问题标题】：Histogram of Oriented Gradients in multi-scale (mean-shift?)多尺度定向梯度直方图（均值偏移？）
【发布时间】：2011-05-05 10:06:51
【问题描述】：

我正在研究 HOG 描述符，除了检测窗口的融合之外，我已经完成了大部分工作。

到目前为止，我所做的是；我构建了图像的尺度空间金字塔，对于每个尺度上的每个图像，我移动检测窗口（64x128）并检测人类。在每张图像中，一个人被多个窗口检测到。

所以问题是如何将所有这些窗口（假设为一个人）融合到一个窗口中。 Dalal 建议应该使用稳健的模检测算法，例如均值偏移。但是，我有多个尺度……我是否应该首先估计在尺度空间的较低级别中找到的检测窗口的真实位置才能做到这一点？

感谢任何帮助。提前致谢。

【问题讨论】：

【解决方案1】：

我的解释是，平均偏移实际上会给你你的建议。

本质上，您首先根据检测器输出的强度以最粗略的尺度估计人员位置的概率分布。这为您提供了对模式的可靠估计。

然后，您可以使用最大值或模式周围的更精细的比例进行迭代优化。

这个想法与金字塔式 LK 跟踪中使用的想法非常相似，例如。您还可以进行集成处理和/或粒子过滤器。

【讨论】：