目标检测环境以及数据集
目标检测环境以及数据集
环境
- pyton:3.8
- cuda:11.3,cudnn:8302
- pytorch:1.12.1
- torch:0.13.1
- numpy
- matplotlib
- pycocotools
- lxml
- pillow
- wandb
数据集
PASCAL VOC 文件目录
├── VOCdevkit
│ └── VOC2007/2012
│ ├── Annotations
│ ├── ImageSets
│ ├── JPEGImages
│ ├── SegmentationClass(检测不用)
│ └── SegmentationObject(检测不用)
2007
Pascal VOC2007 train/val数据集(450M)下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
Pascal VOC2007 test数据集(430M)下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
train+val
1 训练数据:2501张图像,共6301个目标 2 验证数据:2510张图像,共6307个目标 3 训练+验证数据:5011张图像,共12608个目标
test
1 测试数据:4952张图像,共12032个目标
2012
Pascal VOC2012 train/val数据集(2G)下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
Pascal VOC2012 test数据集下载地址:未开放
train+val
1 训练数据:5717张图像,共13609个目标 2 验证数据:5823张图像,共13841个目标 3 训练+验证数据:11540张图像,共27450个目标
2007+2012
07+12: union of VOC2007 and VOC2012 trainval,在07test上测试
1 07+12: 2 train on union of VOC2007 and VOC2012 trainval 3 test on VOC2007test 4 训练数据:16551张图像 5 测试数据:4952张图像 6 训练+验证数据:21503张图像
可以重新创建一个文件夹叫做VOC0712,在其下建立JPEGImages、ImageSets、Annotations三个文件夹
然后把2007和2012的JPEGImages、Annotations中的图片和标注全部放一块,再分别放入之前新建立的文件夹中
这样JPEGImages、Annotations中的文件数目各有(17125+5011+4952=27088)
在ImageSets中建立一个main文件夹,在main文件夹中创建两个文件train.txt以及test.txt,将07和12中的txt内容合并
1 train.txt:VOC2007-ImageSets-main-trainval.txt+2012中的trainval.txt 2 test.txt:VOC2007-ImageSets-main-test.txt
最后合并后train.txt文件有11540+5011=16551行,test.txt:4952行
简单的说就是重新创一个文件结构相同的文件夹,将07+12需要的内容合并就行了
常用数据集
默认博主都是用2012年的train来训练,val来验证,主要是为了统一各目标检测模型,方便对比,训练也快速,07+12也可以,不过图片还是多了,博主就为了简单的比较的话没啥必要
参考:
【目标检测适用】Pascal Voc(07+12)联合训练并在07上测试_leSerein_的博客-CSDN博客