1. 下载

Pascal VOC网址:

http://host.robots.ox.ac.uk/pascal/VOC/

Pascal voc 2012 数据集下载地址:

http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

得到如下压缩包:

Pascal voc 2012 数据集简介

解压后得到如下文件夹:

Pascal voc 2012 数据集简介

打开后又是一个文件夹:

Pascal voc 2012 数据集简介

再打开就是5个文件夹了:

Pascal voc 2012 数据集简介

2. 介绍:

(1)Annotations

Annotations文件夹中存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹中的一张图片,共计17125个文件,如下所示:

Pascal voc 2012 数据集简介

以2007_000027.xml和2007_000032.xml文件为例,打开xml文件(截取部分):

2007_000027.xml文件:

Pascal voc 2012 数据集简介

2007_000032.xml文件:

Pascal voc 2012 数据集简介

红框标注部分表示是否可以用于分割:0否;1是。

(2)ImageSets

ImageSets存放的是每一种类型的challenge对应的图像数据。

在ImageSets下有四个文件夹:

Pascal voc 2012 数据集简介

Action:存放的是人的动作(running、jumping等等)

Pascal voc 2012 数据集简介

Layout:存放的是具有人体部位的数据(人的head、hand、feet等等)

Pascal voc 2012 数据集简介

Main:存放的是图像物体识别的数据,总共分为20类。

Pascal voc 2012 数据集简介

Segmentation:存放的是可用于分割的数据。

Pascal voc 2012 数据集简介

主要看Segmentation文件夹。其中包含了train.txt(1416张图)、val.txt(1449张图)和trainval.txt(2913张图)三个文本文件,里面储存的是用于语义分割的图片的名字(无扩展名)。train和val两者没有交集,即训练数据和验证数据不能有重复,随机产生而trainval则是两者的总和。

Pascal voc 2012 数据集简介

(3)JPEGImages

JPEGImages文件夹中包含了PASCAL VOC提供的所有的就jpg图片,共计17125张,包括了训练和测试图片。

这些图像都以“年份_编号.jpg”格式命名。

图片的像素尺寸大小不一,但是横向图的尺寸大约在500*375左右,纵向图的尺寸大约在375*500左右,长宽均不会超过512。

Pascal voc 2012 数据集简介

 

(4)SegmentationClass

保存了分割后的图片,2913张png图片。标注出每一个像素的类别。

Pascal voc 2012 数据集简介

(5)SegmentationObject

保存了分割后的图片,2913张png图片。标注出每一个像素属于哪一个物体。

Pascal voc 2012 数据集简介

 

相关文章: