【问题标题】:AdaBoost and Viola Jones: What training set to use? [closed]AdaBoost 和 Viola Jones:使用什么训练集? [关闭]
【发布时间】:2018-06-05 17:47:58
【问题描述】:
我已经实现了我自己的 Viola Jones 人脸识别算法版本,它使用 AdaBoost 作为构建分类委员会的元数据。我的目标是建立一个可以识别图像中是否有人脸的分类器。我正在努力寻找足够的训练数据集来尝试该算法。特别是我不知道在哪里可以找到一组负面图像(即不包含人脸的图像)。对于正数据集,我将尝试 Wild dataset link 中的 Labeled Faces。
什么是好的负数据集?
【问题讨论】:
标签:
python
machine-learning
computer-vision
image-recognition
viola-jones
【解决方案1】:
一些可能对您的问题有效的解决方案是:
环顾四周,this 资源似乎有一个非人脸数据集。
您可以考虑的另一个数据集是 Google“事物”数据集,找到 here, (description)。
您可能会考虑构建自己的数据集。如果您要使用 LFW 数据集和严重受限(裁剪)的图像,您可以获取一个缩小照片的数据库,无论有没有人,在其上运行标准人脸检测算法以确定人脸的位置,然后裁剪在裁剪区域中有人脸和没有人脸的情况下,都可以取出人脸大小的部分。一些数据集,例如VGG face,有面部图像,并给出了它们的边界框。你可以考虑使用类似的东西。
您也可以使用任何您知道其中没有面孔的数据集,只要它描述了您的算法可能遇到的场景。例如,CIFAR 10 和 CIFAR 100 集具有很棒的户外场景,包括一些动物面孔的特写镜头,这可能对您的算法不利。你可以找到它here。另一个是Image Net 集。
选择此数据集时应小心,因为如果您不小心,它很容易引入偏见。