【问题标题】:Trilinear interpolation in HOGHOG中的三线性插值
【发布时间】:2013-08-19 14:33:00
【问题描述】:
我目前正在Matlab中实现HOG,但我不了解binning,尤其是三线性插值部分。
我的理解是,一个单元格中的每个像素都被放入一个 bin 中以形成该单元格的直方图。但这就是我对 atm 的理解。
- 幅度是如何计算的?
- 立方体的边缘是什么,一个像素的 3D 坐标是什么?
【问题讨论】:
标签:
image-processing
feature-extraction
【解决方案1】:
Wikipedia 描述了梯度(在图像的上下文中),并展示了如何获取其x 和y 坐标。
幅度是如何计算的?
r = sqrt(x*x+y*y)
一个像素的 3D 坐标是多少?
在计算梯度时,图像被视为高度图。对于位于(x,y) 位置的像素,其灰度值为z,它表示高度图3D 位置(x,y,z)。
(x,y,z) 处的渐变具有方向和大小。直方图是将所有可能的方向离散化到 bin 中。例如,对于 8 个 bin,从 0 到 45 度的所有方向都将关联到同一个 bin。
bin 的选择基于梯度方向,并根据幅度向 bin 添加权重。
Wikipedia描述了HOG的步骤,并在原论文中给出了详细的指针。