【发布时间】:2017-03-28 19:26:21
【问题描述】:
我正在尝试训练一个执行图像分割的 CNN 模型, 但是如果我有几个,我很困惑如何创建基本事实 图片样本?
图像分割可以将输入图像中的每个像素分类为 预定义的类,例如汽车、建筑物、人或任何其他。
是否有任何工具或一些好主意来创建地面 图像分割的真相?
谢谢!
【问题讨论】:
标签: annotations neural-network deep-learning image-segmentation
我正在尝试训练一个执行图像分割的 CNN 模型, 但是如果我有几个,我很困惑如何创建基本事实 图片样本?
图像分割可以将输入图像中的每个像素分类为 预定义的类,例如汽车、建筑物、人或任何其他。
是否有任何工具或一些好主意来创建地面 图像分割的真相?
谢谢!
【问题讨论】:
标签: annotations neural-network deep-learning image-segmentation
对于语义分割,应标记图像的每个像素。有以下三种方式来解决这个任务:
基于矢量 - 多边形、折线
基于像素 - 画笔、橡皮擦
人工智能工具
在Supervisely 中,提供了执行 1、2、3 的工具。
以下是比较多边形与人工智能工具的两个视频:cars segmentation 和 food segmentation。
更多关于 Supervisely 标注功能的详细信息,请参见here。
【讨论】:
想到的一个工具是MIT's LabelMe toolbox:这个工具箱主要用于浏览数据集中现有的标记图像,但它也可以选择注释新图像。
还有this github repository 的COCO UI,您可能会觉得有用。
【讨论】:
【讨论】:
我创建了一个名为 COCO Annotator 的开源工具:它提供了其他工具所缺乏的任何功能:
【讨论】:
SageMaker Ground Truth 具有数据集管理和 UI 以支持语义分割。 https://aws.amazon.com/sagemaker/groundtruth/
我们最近发布了对 UI 的增强功能,它通过自动查找区域边界来显着加快注释速度。在这里阅读:https://aws.amazon.com/blogs/machine-learning/auto-segmenting-objects-when-performing-semantic-segmentation-labeling-with-amazon-sagemaker-ground-truth/
【讨论】:
整体流程为:
注解过程详解
一般来说,基于矢量的工具是首选,因为它们更准确。 例如,左边是 4 个多边形点,右边是画笔。
直观地计算它甚至可以更快地找出点。例如在这里,我只是将鼠标移到记录此内容的大纲上:
使用其他形状
例如,您可以使用椭圆或圆形来创建分割蒙版。 不需要手动创建多边形。
自动加边框
想要达到 100% 像素覆盖率背后的主要概念之一是称为自动边框的概念。基本上它只是意味着对象的边缘相交很好。例如,在 Diffgram 中,您可以选择两个点,它将创建一个匹配的边框。
最后还有很多其他概念,例如预标记、复制到下一个、跟踪等。
工具
Diffgram 的Segmentation Labeling Software 是图像和视频注释的绝佳工具选项。它是开放核心的,您可以在your kubernetes cluster 上运行它。
【讨论】:
您可以在整个数据集上使用平均和归一化技术,从而创建您的基本事实,然后标记不同的结构。为此,您可以考虑创建一个所谓的|模板|。确保您的所有数据最初都是共同注册的。
【讨论】: