深度学习：如何处理输入大小的变化

【问题标题】：Deep learning: howto handle variation in input size深度学习：如何处理输入大小的变化
【发布时间】：2021-04-16 15:25:42
【问题描述】：

我想做一个回归任务（在一些大小约为 150x 70 像素的图像中查找对象的 x,y 位置）。因此，我有大约 2000 个带注释的图像（我可以注释更多可能多达 20000 个）。我的第一个想法是使用 CNN，但我的输入数据的大小并不一致，我不想通过调整大小或裁剪图像来丢失特征。你怎么看？ 有没有比使用 CNN 更好的方法？如何处理这种图像大小的变化？

【问题讨论】：

标签： deep-learning regression conv-neural-network object-detection

【解决方案1】：

好的，如果您不想重新缩放或裁剪，这就是问题所在。那么你将无法进行批处理。

您可以将输入图像缩放为一种尺寸。只需确保所有训练图像的大小相同，并且需要对基本事实（绑定框）进行类似的转换。

大问题：我不想将变换应用到边界框，这样做很复杂？

这是一个简单的库专辑，可以为您完成所有这些工作。你不必担心数学- 图书馆 - https://github.com/albumentations-team/albumentations

【讨论】：

感谢您的回答。为什么我不能创建批次来训练我的网络？我想找到一个物体的中心。所以我想对 x,y 坐标进行回归。图像已经增强和标准化（未调整大小）。图书馆看起来不错，谢谢。