【问题标题】:Cropping/Scaling ImageNet Images裁剪/缩放 ImageNet 图像
【发布时间】:2016-08-29 05:10:15
【问题描述】:

ImageNet 图像都是不同大小的,但神经网络需要固定大小的输入。

一种解决方案是采用与图像一样大的裁剪尺寸,以图像的中心点为中心。这可行,但有一些缺点。图像中感兴趣对象的重要部分经常被切掉,甚至在某些情况下,正确的对象完全丢失,而属于不同类别的另一个对象是可见的,这意味着您的模型将针对该图像进行错误的训练.

另一种解决方案是使用整个图像并将其零填充到每个图像具有相同尺寸的位置。不过,这似乎会干扰训练过程,并且模型将学会在图像边缘附近寻找垂直/水平的黑色斑块。

通常会做什么?

【问题讨论】:

    标签: neural-network crop imagenet


    【解决方案1】:

    有几种方法:

    • 多种作物。例如,AlexNet 最初是针对 5 种不同的作物进行训练的:中心、左上角、右上角、左下角、右下角。
    • 随机作物。只需从图像中随机抽取一些裁剪,希望神经网络不会有偏差。
    • 调整大小和变形。在不考虑纵横比的情况下将图像调整为固定大小。这会使图像内容变形但会保留,但现在您可以确定没有内容被剪切。
    • 可变大小的输入。不要在可变大小的图像上裁剪和训练网络,使用诸如 Spatial Pyramid Pooling 之类的东西来提取可用于全连接层的固定大小的特征向量。

    您可以看看最新的 ImageNet 网络是如何训练的,例如 VGG 和 ResNet。他们通常会详细描述这一步。

    【讨论】:

    • 在调整大小之前看到一种方法是否常见?
    • @kwotsin 我想只要您在裁剪中保留足够大的图像部分,顺序并不重要。
    • 其中一些方法听起来像是用于培训。为了验证,我检查了this 示例,该示例似乎调整为 256,然后居中裁剪 224x224。 (我相信这就是 AlexNet 最初的处理方式,对吧?)
    猜你喜欢
    • 2017-06-18
    • 1970-01-01
    • 1970-01-01
    • 2012-07-21
    • 2013-02-15
    • 1970-01-01
    • 1970-01-01
    • 2015-04-20
    • 1970-01-01
    相关资源
    最近更新 更多