AdaBoost 和 Viola Jones：使用什么训练集？ [关闭]答案

【问题标题】：AdaBoost and Viola Jones: What training set to use? [closed]AdaBoost 和 Viola Jones：使用什么训练集？ [关闭]
【发布时间】：2018-06-05 17:47:58
【问题描述】：

我已经实现了我自己的 Viola Jones 人脸识别算法版本，它使用 AdaBoost 作为构建分类委员会的元数据。我的目标是建立一个可以识别图像中是否有人脸的分类器。我正在努力寻找足够的训练数据集来尝试该算法。特别是我不知道在哪里可以找到一组负面图像（即不包含人脸的图像）。对于正数据集，我将尝试 Wild dataset link 中的 Labeled Faces。

什么是好的负数据集？

【问题讨论】：

标签： python machine-learning computer-vision image-recognition viola-jones

【解决方案1】：

一些可能对您的问题有效的解决方案是：

环顾四周，this 资源似乎有一个非人脸数据集。
您可以考虑的另一个数据集是 Google“事物”数据集，找到 here, (description)。
您可能会考虑构建自己的数据集。如果您要使用 LFW 数据集和严重受限（裁剪）的图像，您可以获取一个缩小照片的数据库，无论有没有人，在其上运行标准人脸检测算法以确定人脸的位置，然后裁剪在裁剪区域中有人脸和没有人脸的情况下，都可以取出人脸大小的部分。一些数据集，例如VGG face，有面部图像，并给出了它们的边界框。你可以考虑使用类似的东西。
您也可以使用任何您知道其中没有面孔的数据集，只要它描述了您的算法可能遇到的场景。例如，CIFAR 10 和 CIFAR 100 集具有很棒的户外场景，包括一些动物面孔的特写镜头，这可能对您的算法不利。你可以找到它here。另一个是Image Net 集。

选择此数据集时应小心，因为如果您不小心，它很容易引入偏见。

【讨论】：