1. 下载
Pascal VOC网址:
http://host.robots.ox.ac.uk/pascal/VOC/
Pascal voc 2012 数据集下载地址:
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
得到如下压缩包:
解压后得到如下文件夹:
打开后又是一个文件夹:
再打开就是5个文件夹了:
2. 介绍:
(1)Annotations
Annotations文件夹中存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹中的一张图片,共计17125个文件,如下所示:
以2007_000027.xml和2007_000032.xml文件为例,打开xml文件(截取部分):
2007_000027.xml文件:
2007_000032.xml文件:
红框标注部分表示是否可以用于分割:0否;1是。
(2)ImageSets
ImageSets存放的是每一种类型的challenge对应的图像数据。
在ImageSets下有四个文件夹:
Action:存放的是人的动作(running、jumping等等)
Layout:存放的是具有人体部位的数据(人的head、hand、feet等等)
Main:存放的是图像物体识别的数据,总共分为20类。
Segmentation:存放的是可用于分割的数据。
主要看Segmentation文件夹。其中包含了train.txt(1416张图)、val.txt(1449张图)和trainval.txt(2913张图)三个文本文件,里面储存的是用于语义分割的图片的名字(无扩展名)。train和val两者没有交集,即训练数据和验证数据不能有重复,随机产生而trainval则是两者的总和。
(3)JPEGImages
JPEGImages文件夹中包含了PASCAL VOC提供的所有的就jpg图片,共计17125张,包括了训练和测试图片。
这些图像都以“年份_编号.jpg”格式命名。
图片的像素尺寸大小不一,但是横向图的尺寸大约在500*375左右,纵向图的尺寸大约在375*500左右,长宽均不会超过512。
(4)SegmentationClass
保存了分割后的图片,2913张png图片。标注出每一个像素的类别。
(5)SegmentationObject
保存了分割后的图片,2913张png图片。标注出每一个像素属于哪一个物体。