在 CNN 中出现“像素被敲掉”是什么意思？ [关闭]

【问题标题】：What does it mean to have a "pixel is knocked off" in CNN? [closed]在 CNN 中出现“像素被敲掉”是什么意思？ [关闭]
【发布时间】：2022-01-11 01:13:21
【问题描述】：

我正在读一本书，其中有一节介绍了内核在 CNN 中的工作原理：https://freecontent.manning.com/deep-learning-for-image-like-data/。

在图像上滑动内核并要求整个内核在完全在图像内的每个位置，产生一个激活缩小尺寸的地图。例如，如果你有一个 3 x 3 内核在所有方面，一个像素在生成的激活图中被剔除；在 5 x 5 内核的情况下，甚至是两个像素。

这里有一个或两个像素被敲掉是什么意思？

【问题讨论】：

我投票结束这个问题，因为它与 help center 中定义的编程无关，而是关于 ML 理论和/或方法 - 请参阅 stackoverflow.com/tags/machine-learning/info 中的介绍和注意事项跨度>

标签： machine-learning deep-learning neural-network conv-neural-network

【解决方案1】：

他们的意思是，如果没有额外的填充，使用 3x3 内核将在输出中每边“松散”一个像素。因此，如果您的输入图像为 NxN，则输出将为 (N-2)x(N-2)。

例如，当 N=5 时，您可以看到当内核“适合”到右下角时，它的中心“在水平轴和垂直轴上都相差一个像素”。

a a a a a           . . . . .
a a a a a           . b b b .
a a x x x    ===>   . b b b .
a a x X x           . b b B . 
a a x x x           . . . . .

 5 x 5                3 x 3

为了避免这个问题，我们使用了各种填充策略，例如用 0“包围你的图片”以保持大小

0 0 0 0 0 0 0            . . . . . . .
0 a a a a a 0            . b b b b b .
0 a a a a a 0            . b b b b b .
0 a a a a a 0     ===>   . b b b b b .
0 a a a x x x            . b b b b b .
0 a a a x X x            . b b b b B .
0 0 0 0 x x x            . . . . . . .

 5 x 5 + pad                5 x 5

【讨论】：