Aeqitas有效地生成输入,以发现所有主题分类器中的存在的歧视性,并使用生成的测试输入系统地提高各个模型的公平性。主要创新在于提出了一种新的搜索方法,扩充了原始的训练集。
这篇论文主要是设计可扩展的技术,促进快速发现歧视性的输入。主要思想是首先对输入空间进行随机采样,以发现歧视性输入的存在。然后,我们搜索这些输入的邻域,一般是设置向上和向下的一个单位为基准进行搜索,以发现更多带有歧视性输入的存在。论文中提出了全局搜索和局部搜索,首先是通过局部搜索发现一个带有歧视性的输入,然后以这个输入为起点在局部搜索范围内查找是否存在其他的歧视性输入的存在,找到之后将这些输入添加到测试集中,再训练优化模型,以便找到更多的歧视性的存在。
实验表明这种方法在测试实例数量上后很大的优势,能够找到足够多的带有歧视性的输入,充分满足模型训练的数据量,在时间上也提高了很多。这种方法在不同的分类器上进行了实验,这些分类器评估Aeqitas的有效性。