【问题标题】:Trilinear interpolation in HOGHOG中的三线性插值
【发布时间】:2013-08-19 14:33:00
【问题描述】:

我目前正在Matlab中实现HOG,但我不了解binning,尤其是三线性插值部分。

我的理解是,一个单元格中的每个像素都被放入一个 bin 中以形成该单元格的直方图。但这就是我对 atm 的理解。

  1. 幅度是如何计算的?
  2. 立方体的边缘是什么,一个像素的 3D 坐标是什么?

【问题讨论】:

  • 你检查他的link 以获得清晰的想法

标签: image-processing feature-extraction


【解决方案1】:

Wikipedia 描述了梯度(在图像的上下文中),并展示了如何获取其xy 坐标。

幅度是如何计算的?

r = sqrt(x*x+y*y)

一个像素的 3D 坐标是多少?

在计算梯度时,图像被视为高度图。对于位于(x,y) 位置的像素,其灰度值为z,它表示高度图3D 位置(x,y,z)

(x,y,z) 处的渐变具有方向和大小。直方图是将所有可能的方向离散化到 bin 中。例如,对于 8 个 bin,从 0 到 45 度的所有方向都将关联到同一个 bin。

bin 的选择基于梯度方向,并根据幅度向 bin 添加权重。

Wikipedia描述了HOG的步骤,并在原论文中给出了详细的指针。

【讨论】:

    猜你喜欢
    • 2011-09-27
    • 1970-01-01
    • 2010-12-11
    • 1970-01-01
    • 2023-03-04
    • 1970-01-01
    • 1970-01-01
    • 2019-06-27
    • 1970-01-01
    相关资源
    最近更新 更多