【问题标题】:what is anisotropic scaling in computer vision?什么是计算机视觉中的各向异性缩放?
【发布时间】:2017-09-20 11:51:26
【问题描述】:

什么是各向异性缩放?它是如何实现图像处理和计算机视觉的?

我知道它是某种形式的non-uniform scaling,正如维基百科所说,但我仍然没有很好地理解它在应用于图像时的实际含义。最近,一些深度学习架构(如用于对象检测的 R-CNN)也使用了它,但对这个主题的关注并不多。

任何能清楚地解释这个概念的例子和视觉插图都会非常好。

【问题讨论】:

  • 我没有领域知识,但语言上的“各向异性”和“非均匀”是同义词。基于此,我想象一个由对角矩阵定义的线性变换,其对角线不相等。更一般地说,我猜它是具有两个垂直特征向量和两个不相等特征值的线性变换。

标签: image-processing geometry computer-vision deep-learning


【解决方案1】:

非均匀缩放只是意味着对每个维度应用不同的比例,使其各向异性。相反的是各向同性缩放,每个维度都应用相同的比例。

在 R-CNN 的上下文中,作者做了一个技巧,在分类网络中使用可变大小的图像,他们将任何图像调整为固定大小(我相信它是 224x224),这是独立于方面的图像的比例。所以假设你有一个 1280x720 的图像,如果它被调整为 224x244,那么比例是 1280/224 和 720/224,这显然是不一样的,因此是各向异性缩放。

【讨论】:

  • 您能否添加更多关于此的信息?一些视觉插图会很棒!
【解决方案2】:

@kmario23 在 CV 和 CG 的上下文中,一个很好的例子是 Affinity Transformation https://web.stanford.edu/class/cs231a/

不同于相似性变换,我们有一个各向同性的缩放。但是 D 是各向异性缩放的一个例子,因为 s_x 与 s_y 不同。

$$
\begin{bmatrix} s_x & 0 \\ 0 & s_y \end{bmatrix}
$$

 Instead for an isotropic scaling  we would have

$$
\begin{bmatrix} s & 0 \\ 0 & s \end{bmatrix}
$$

如果您正在寻找图片,我会推荐此演示文稿 [Michael Bronstein。] https://slideslive.com/38959806/geometric-deep-learning-the-erlangen-programme-of-ml?ref=speaker-16382-latest

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-08-16
    • 2013-11-27
    • 2023-03-04
    • 2016-04-30
    • 1970-01-01
    • 1970-01-01
    • 2018-11-07
    • 1970-01-01
    相关资源
    最近更新 更多