【问题标题】:How to annotate the ground truth for image segmentation?如何注释图像分割的基本事实?
【发布时间】:2017-03-28 19:26:21
【问题描述】:

我正在尝试训练一个执行图像分割的 CNN 模型, 但是如果我有几个,我很困惑如何创建基本事实 图片样本?

图像分割可以将输入图像中的每个像素分类为 预定义的类,例如汽车、建筑物、人或任何其他。

是否有任何工具或一些好主意来创建地面 图像分割的真相?

谢谢!

【问题讨论】:

    标签: annotations neural-network deep-learning image-segmentation


    【解决方案1】:

    对于语义分割,应标记图像的每个像素。有以下三种方式来解决这个任务:

    1. 基于矢量 - 多边形、折线

    2. 基于像素 - 画笔、橡皮擦

    3. 人工智能工具

    Supervisely 中,提供了执行 1、2、3 的工具。

    以下是比较多边形与人工智能工具的两个视频:cars segmentationfood segmentation

    更多关于 Supervisely 标注功能的详细信息,请参见here

    【讨论】:

      【解决方案2】:

      想到的一个工具是MIT's LabelMe toolbox:这个工具箱主要用于浏览数据集中现有的标记图像,但它也可以选择注释新图像。

      还有this github repositoryCOCO UI,您可能会觉得有用。

      【讨论】:

      • 如何将每个像素标记到对象类中?之后我们是否有一个数组,每个像素的类。
      • @ShamaneSiriwardhana 您通常会得到与原始图像大小相同的索引图像。
      • 假设我在一张图像中有 3 个对象。那么我该如何注释呢?你能帮我吗
      • 给现在阅读的人请注意,LabelMe 似乎已经很老了,托管常见问题解答/讨论的留言板将于 2021 年 12 月 11 日关闭。quicktopic.com/37/H/E4xRZ7fZZhh
      【解决方案3】:

      试试https://www.labelbox.io/。这是他们的图像分割模板的样子......

      很多代码是open source,他们有一个托管服务来管理端到端的标签。

      【讨论】:

        【解决方案4】:

        我创建了一个名为 COCO Annotator 的开源工具:它提供了其他工具所缺乏的任何功能:

        • 直接导出为COCO格式
        • 对象分割
        • 用于分析数据的有用 API 端点
        • 导入已以 COCO 格式注释的数据集
        • 将断开连接的对象作为单个实例进行注释
        • 同时使用任意数量的标签标记图像片段
        • 允许每个实例或对象的自定义元数据
        • 魔杖/选择工具
        • 使用谷歌图片生成数据集
        • 用户认证系统

        【讨论】:

          【解决方案5】:

          SageMaker Ground Truth 具有数据集管理和 UI 以支持语义分割。 https://aws.amazon.com/sagemaker/groundtruth/

          我们最近发布了对 UI 的增强功能,它通过自动查找区域边界来显着加快注释速度。在这里阅读:https://aws.amazon.com/blogs/machine-learning/auto-segmenting-objects-when-performing-semantic-segmentation-labeling-with-amazon-sagemaker-ground-truth/

          【讨论】:

            【解决方案6】:

            整体流程为:

            1. 将数据加载到工具中
            2. 画一个形状。例如。使用多边形工具或其他形状工具
            3. 导出点并直接用于训练,或将其转换为密集像素掩码。

            注解过程详解

            一般来说,基于矢量的工具是首选,因为它们更准确。 例如,左边是 4 个多边形点,右边是画笔。

            直观地计算它甚至可以更快地找出点。例如在这里,我只是将鼠标移到记录此内容的大纲上:

            但它实际上存储为点:

            使用其他形状

            例如,您可以使用椭圆或圆形来创建分割蒙版。 不需要手动创建多边形。

            自动加边框

            想要达到 100% 像素覆盖率背后的主要概念之一是称为自动边框的概念。基本上它只是意味着对象的边缘相交很好。例如,在 Diffgram 中,您可以选择两个点,它将创建一个匹配的边框。

            这是一个例子:

            最后还有很多其他概念,例如预标记、复制到下一个、跟踪等。

            工具

            Diffgram 的Segmentation Labeling Software 是图像和视频注释的绝佳工具选项。它是开放核心的,您可以在your kubernetes cluster 上运行它。

            【讨论】:

              【解决方案7】:

              您可以在整个数据集上使用平均和归一化技术,从而创建您的基本事实,然后标记不同的结构。为此,您可以考虑创建一个所谓的|模板|。确保您的所有数据最初都是共同注册的。

              【讨论】:

                猜你喜欢
                • 1970-01-01
                • 2020-11-17
                • 2019-12-10
                • 2017-08-05
                • 2017-07-24
                • 1970-01-01
                • 1970-01-01
                • 1970-01-01
                • 2013-09-29
                相关资源
                最近更新 更多