【发布时间】:2018-08-18 04:56:25
【问题描述】:
在尝试使用在另一个数据集 (Cityscapes) 上训练的深度学习网络对来自一个数据集 (KITTI) 的图像执行图像分割时,我意识到输出的主观感知质量存在很大差异(和可能也在对 (m)IoU 进行基准测试时。
这提出了我的问题,输入图像的大小/分辨率是否以及如何影响语义图像分割网络的输出,该网络已在与输入图像不同大小或分辨率的图像上进行了训练。
我附上了来自该网络的两个图像及其对应的输出图像:https://github.com/hellochick/PSPNet-tensorflow(使用提供的权重)。
第一张图片来自 CityScapes 数据集(测试集),宽度和高度为 (2048,1024)。该网络已使用来自该数据集的训练和验证图像进行了训练。
第二张图片来自 KITTI 数据集,宽度和高度为 (1242,375):
如您所见,第一个分割图像中的形状被清晰定义,而在第二个分割图像中,对象的详细分离是不可能的。
【问题讨论】:
标签: tensorflow machine-learning computer-vision deep-learning image-segmentation