一、数据来源

COCO中图片资源均引用自Flickr图片网站

二、数据集创建目的

进行图像识别训练,主要针对以下三个方向:

(1)object instances

(2)object keypoints

(3) image captions

每个方向均包含训练和验证集两个标注文件

三、标注体结构

三个方向均共享基本类型信息,包括info、image、license三个字段,而annotation字段则各不相同。

3.1 通用字段介绍

  • 通用-Info字段

MS COCO 数据集学习笔记(Common Objects in COntext)

 

例:

MS COCO 数据集学习笔记(Common Objects in COntext)

 

 

  • 通用-image字段

MS COCO 数据集学习笔记(Common Objects in COntext)

 

例:

MS COCO 数据集学习笔记(Common Objects in COntext)

 

  • 通用-licence字段

MS COCO 数据集学习笔记(Common Objects in COntext)

例:

MS COCO 数据集学习笔记(Common Objects in COntext)

 

3.2 变体字段介绍

  • annotation-Object Instance

MS COCO 数据集学习笔记(Common Objects in COntext)

iscrowd=0:表示这是一个单独的物体,轮廓用Polygon(多边形的点)表示,即segmentation字段用Polygon表示
iscrowd=1:表示两个或多个没有分开的物体,轮廓用RLE编码表示,即segmention字段用RLE编码形式表示
 
  • annotation-Object keypoint
相比于object Instance标注,增加了两个字段:Keypoints和num_keypoints
keypoints是一个长度为3*k的数组,其中k是keypoints的总数量。
keypoints[i][0] 和keypoints[i][1]为(x,y),keypoints[i][2]为标志位v
v=0-关键点未标注,v=2-关键点已标注且不可见,v=3-关键点已标注且可见
 
MS COCO 数据集学习笔记(Common Objects in COntext)

 

category字段:

 keypoints字段记录了关键点名字数组,skeleton定义了各个关键点之间的连接性(如手腕和肘)。keypoints的supercategory只标注了person 。

MS COCO 数据集学习笔记(Common Objects in COntext)

 

 Image Caption类型的标注相对于上面来说很简单,这里就略过不表了

相关文章:

  • 2022-12-23
  • 2021-04-20
  • 2021-08-09
  • 2021-09-29
  • 2021-07-20
  • 2022-12-23
  • 2021-11-29
  • 2021-09-09
猜你喜欢
  • 2021-09-11
  • 2022-01-02
  • 2021-11-05
  • 2021-05-13
  • 2021-06-17
  • 2021-12-17
  • 2021-12-21
相关资源
相似解决方案