如何注释图像分割的基本事实？答案

【问题标题】：How to annotate the ground truth for image segmentation?如何注释图像分割的基本事实？
【发布时间】：2017-03-28 19:26:21
【问题描述】：

我正在尝试训练一个执行图像分割的 CNN 模型，但是如果我有几个，我很困惑如何创建基本事实图片样本？

图像分割可以将输入图像中的每个像素分类为预定义的类，例如汽车、建筑物、人或任何其他。

是否有任何工具或一些好主意来创建地面图像分割的真相？

谢谢！

【问题讨论】：

标签： annotations neural-network deep-learning image-segmentation

【解决方案1】：

对于语义分割，应标记图像的每个像素。有以下三种方式来解决这个任务：

基于矢量 - 多边形、折线
基于像素 - 画笔、橡皮擦
人工智能工具

在Supervisely 中，提供了执行 1、2、3 的工具。

以下是比较多边形与人工智能工具的两个视频：cars segmentation 和 food segmentation。

更多关于 Supervisely 标注功能的详细信息，请参见here。

【讨论】：

【解决方案2】：

想到的一个工具是MIT's LabelMe toolbox：这个工具箱主要用于浏览数据集中现有的标记图像，但它也可以选择注释新图像。

还有this github repository 的COCO UI，您可能会觉得有用。

【讨论】：

如何将每个像素标记到对象类中？之后我们是否有一个数组，每个像素的类。
@ShamaneSiriwardhana 您通常会得到与原始图像大小相同的索引图像。
假设我在一张图像中有 3 个对象。那么我该如何注释呢？你能帮我吗
给现在阅读的人请注意，LabelMe 似乎已经很老了，托管常见问题解答/讨论的留言板将于 2021 年 12 月 11 日关闭。quicktopic.com/37/H/E4xRZ7fZZhh

【解决方案3】：

试试https://www.labelbox.io/。这是他们的图像分割模板的样子......

很多代码是open source，他们有一个托管服务来管理端到端的标签。

【讨论】：

【解决方案4】：

我创建了一个名为 COCO Annotator 的开源工具：它提供了其他工具所缺乏的任何功能：

直接导出为COCO格式
对象分割
用于分析数据的有用 API 端点
导入已以 COCO 格式注释的数据集
将断开连接的对象作为单个实例进行注释
同时使用任意数量的标签标记图像片段
允许每个实例或对象的自定义元数据
魔杖/选择工具
使用谷歌图片生成数据集
用户认证系统

【讨论】：

【解决方案5】：

SageMaker Ground Truth 具有数据集管理和 UI 以支持语义分割。 https://aws.amazon.com/sagemaker/groundtruth/

我们最近发布了对 UI 的增强功能，它通过自动查找区域边界来显着加快注释速度。在这里阅读：https://aws.amazon.com/blogs/machine-learning/auto-segmenting-objects-when-performing-semantic-segmentation-labeling-with-amazon-sagemaker-ground-truth/

【讨论】：

【解决方案6】：

整体流程为：

将数据加载到工具中
画一个形状。例如。使用多边形工具或其他形状工具
导出点并直接用于训练，或将其转换为密集像素掩码。

注解过程详解

一般来说，基于矢量的工具是首选，因为它们更准确。例如，左边是 4 个多边形点，右边是画笔。

直观地计算它甚至可以更快地找出点。例如在这里，我只是将鼠标移到记录此内容的大纲上：

但它实际上存储为点：

使用其他形状

例如，您可以使用椭圆或圆形来创建分割蒙版。不需要手动创建多边形。

自动加边框

想要达到 100% 像素覆盖率背后的主要概念之一是称为自动边框的概念。基本上它只是意味着对象的边缘相交很好。例如，在 Diffgram 中，您可以选择两个点，它将创建一个匹配的边框。

这是一个例子：

最后还有很多其他概念，例如预标记、复制到下一个、跟踪等。

工具

Diffgram 的Segmentation Labeling Software 是图像和视频注释的绝佳工具选项。它是开放核心的，您可以在your kubernetes cluster 上运行它。

【讨论】：

【解决方案7】：

您可以在整个数据集上使用平均和归一化技术，从而创建您的基本事实，然后标记不同的结构。为此，您可以考虑创建一个所谓的|模板|。确保您的所有数据最初都是共同注册的。

【讨论】：