【发布时间】:2020-09-04 19:17:33
【问题描述】:
我在 Keras 中实现了一个 UNet 分割网络,它简单地将 RGB 图像中的所有像素映射到 4 个类别,这些类别在热图掩码上进行了训练(低、中低、中高、高)。使用 CCE 或分类 Dice 损失,我可以获得不错的结果。
但是,原始形式的掩码是分辨率为 255 位的热图图像。通过将 255 位的分辨率降低为 4 类来将其硬塞到 Unet 中,这似乎是一种完全任意的错误引入。
我希望网络输出每个像素的值介于 (0,1) 之间的图像,并使用通过将热图图像乘以 1./255 生成的掩码训练网络。
在这种情况下,损失函数将包含掩码与网络预测之间的数学差异。谁能指出我做过类似事情的人的方向?我认为我很不擅长用相关术语来描述我正在寻找的东西,因为这似乎是计算机视觉中相当普遍的目标..?
【问题讨论】:
标签: python keras deep-learning computer-vision semantic-segmentation