最近在做一个深度学习的项目,关于的是目标检测的。运用的是yolov4和yolov5两个目标检测模型。两个模型均可以通过作者GitHub进行使用,里面都有详细的教程。在这里我就无耻地贴出我GitHub fork的仓库地址:darknet-yolov4和yolov5。另外很多博主都介绍如何训练自己的数据集,这里也不做详细介绍了。这篇文章主要是记录我在训练过程中遇到的问题。
1. 图片的问题,如下图所示。训练集中的一些图片是8位彩色图像(img.mode is 'P'),这样会导致在训练过程中调用load_image函数报错。(PIL中有九种不同模式。分别为1,L,P,RGB,RGBA,CMYK,YCbCr,I,F。)另外数据集也没有做尺寸统一化处理,虽然问题不大这样会导致训练过程中耗时过大。
2. 标注数据集耗时长,而且只有正样本,后面会考虑添加一些负样本,如一些跟正样本相类似的图像作为训练。
后面继续看相关论文,未完待续。。