目标检测环境以及数据集

call me ZJ / 2023-05-03 / 原文

目标检测环境以及数据集

环境

pyton:3.8
cuda:11.3,cudnn:8302
pytorch:1.12.1
torch:0.13.1
numpy
matplotlib
pycocotools
lxml
pillow
wandb

数据集

PASCAL VOC 文件目录

├── VOCdevkit
│ └── VOC2007/2012
│ ├── Annotations
│ ├── ImageSets
│ ├── JPEGImages
│ ├── SegmentationClass（检测不用）
│ └── SegmentationObject（检测不用）

2007

Pascal VOC2007 train/val数据集(450M)下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar

Pascal VOC2007 test数据集(430M)下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

train+val

1 训练数据：2501张图像，共6301个目标
2 验证数据：2510张图像，共6307个目标
3 训练+验证数据：5011张图像，共12608个目标

test

1 测试数据：4952张图像，共12032个目标

2012

Pascal VOC2012 train/val数据集(2G)下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

Pascal VOC2012 test数据集下载地址：未开放

train+val

1 训练数据：5717张图像，共13609个目标
2 验证数据：5823张图像，共13841个目标
3 训练+验证数据：11540张图像，共27450个目标

2007+2012

07+12: union of VOC2007 and VOC2012 trainval,在07test上测试

1 07+12:
2 train on union of VOC2007 and VOC2012 trainval
3 test on VOC2007test
4 训练数据：16551张图像
5 测试数据：4952张图像
6 训练+验证数据：21503张图像

可以重新创建一个文件夹叫做VOC0712，在其下建立JPEGImages、ImageSets、Annotations三个文件夹

然后把2007和2012的JPEGImages、Annotations中的图片和标注全部放一块，再分别放入之前新建立的文件夹中

这样JPEGImages、Annotations中的文件数目各有（17125+5011+4952=27088）

在ImageSets中建立一个main文件夹，在main文件夹中创建两个文件train.txt以及test.txt,将07和12中的txt内容合并

1 train.txt:VOC2007-ImageSets-main-trainval.txt+2012中的trainval.txt
2 test.txt:VOC2007-ImageSets-main-test.txt

最后合并后train.txt文件有11540+5011=16551行,test.txt:4952行

简单的说就是重新创一个文件结构相同的文件夹，将07+12需要的内容合并就行了

常用数据集

默认博主都是用2012年的train来训练，val来验证，主要是为了统一各目标检测模型，方便对比，训练也快速，07+12也可以，不过图片还是多了，博主就为了简单的比较的话没啥必要

参考：

【目标检测适用】Pascal Voc（07+12）联合训练并在07上测试_leSerein_的博客-CSDN博客