【问题标题】:What does it mean to have a "pixel is knocked off" in CNN? [closed]在 CNN 中出现“像素被敲掉”是什么意思? [关闭]
【发布时间】:2022-01-11 01:13:21
【问题描述】:

我正在读一本书,其中有一节介绍了内核在 CNN 中的工作原理:https://freecontent.manning.com/deep-learning-for-image-like-data/

在图像上滑动内核并要求整个内核 在完全在图像内的每个位置,产生一个激活 缩小尺寸的地图。例如,如果你有一个 3 x 3 内核 在所有方面,一个像素在生成的激活图中被剔除; 在 5 x 5 内核的情况下,甚至是两个像素。

这里有一个或两个像素被敲掉是什么意思?

【问题讨论】:

标签: machine-learning deep-learning neural-network conv-neural-network


【解决方案1】:

他们的意思是,如果没有额外的填充,使用 3x3 内核将在输出中每边“松散”一个像素。因此,如果您的输入图像为 NxN,则输出将为 (N-2)x(N-2)。

例如,当 N=5 时,您可以看到当内核“适合”到右下角时,它的中心“在水平轴和垂直轴上都相差一个像素”。

a a a a a           . . . . .
a a a a a           . b b b .
a a x x x    ===>   . b b b .
a a x X x           . b b B . 
a a x x x           . . . . .

 5 x 5                3 x 3

为了避免这个问题,我们使用了各种填充策略,例如用 0“包围你的图片”以保持大小

0 0 0 0 0 0 0            . . . . . . .
0 a a a a a 0            . b b b b b .
0 a a a a a 0            . b b b b b .
0 a a a a a 0     ===>   . b b b b b .
0 a a a x x x            . b b b b b .
0 a a a x X x            . b b b b B .
0 0 0 0 x x x            . . . . . . .

 5 x 5 + pad                5 x 5

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2010-12-29
    • 2014-09-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-01
    • 2019-09-29
    相关资源
    最近更新 更多