【问题标题】:Deep learning: howto handle variation in input size深度学习:如何处理输入大小的变化
【发布时间】:2021-04-16 15:25:42
【问题描述】:

我想做一个回归任务(在一些大小约为 150x 70 像素的图像中查找对象的 x,y 位置)。因此,我有大约 2000 个带注释的图像(我可以注释更多可能多达 20000 个)。我的第一个想法是使用 CNN,但我的输入数据的大小并不一致,我不想通过调整大小或裁剪图像来丢失特征。你怎么看? 有没有比使用 CNN 更好的方法?如何处理这种图像大小的变化?

【问题讨论】:

    标签: deep-learning regression conv-neural-network object-detection


    【解决方案1】:

    好的,如果您不想重新缩放或裁剪,这就是问题所在。那么你将无法进行批处理。

    您可以将输入图像缩放为一种尺寸。只需确保所有训练图像的大小相同,并且需要对基本事实(绑定框)进行类似的转换。

    大问题:我不想将变换应用到边界框,这样做很复杂?

    这是一个简单的库专辑,可以为您完成所有这些工作。你不必担心数学- 图书馆 - https://github.com/albumentations-team/albumentations

    【讨论】:

    • 感谢您的回答。为什么我不能创建批次来训练我的网络?我想找到一个物体的中心。所以我想对 x,y 坐标进行回归。图像已经增强和标准化(未调整大小)。图书馆看起来不错,谢谢。
    猜你喜欢
    • 2021-04-28
    • 2018-10-24
    • 1970-01-01
    • 2018-12-18
    • 2017-09-14
    • 1970-01-01
    • 2018-11-05
    • 2020-04-23
    • 2020-06-30
    相关资源
    最近更新 更多