【问题标题】:Binary classification with only "yes" instances只有“是”实例的二进制分类
【发布时间】:2016-07-03 02:27:50
【问题描述】:

想象一下我有一个二进制分类的问题。我必须为每个输入元素(是或否)分配一个标签,但在训练集中我只有“是”实例。这很常见,因为很多时候我们想说给定元素是否与给定元素“相似”。我们可以在声音识别或图像识别问题中找到可能的例子。

示例 1:我们有很多狗叫声,并给出了一个新的声音,我们想说它是否是狗叫声

示例 2:我们有很多狗的图片,并给出了一张新图片,我们想说它是否代表一只狗

在常见的机器学习问题中,训练集由“是”实例和“否”实例组成,并给定一个新元素,分类器确定它是否更类似于“是”实例或“否”。

正如上述场景所预期的那样,我们不能有“无”实例,因为它们可能是世界上所有可能的其他声音/图片。

哪些机器学习方法(svm、神经网络、knn、...)可以用来解决这类问题?

【问题讨论】:

  • 你要找的关键词是“一类分类”、“密度估计”、“异常检测”、“新奇检测”

标签: machine-learning neural-network classification svm knn


【解决方案1】:

这是一个称为新颖性检测的问题。

具体来说,您有一个被认为是无噪声的数据集。例如。你有一组代表狗叫的数据集合。

如果你有一些狗叫和一些猫叫,并且想找到将狗和猫分开的边界,这是一个异常值检测问题。

一个简单的例子可以在 SKlearn 文档网站上找到

http://scikit-learn.org/stable/auto_examples/svm/plot_oneclass.html#example-svm-plot-oneclass-py

具体实施将取决于您的数据究竟是什么样的 - 没有包罗万象的解决方案。根据“没有免费午餐”定理,不存在在一系列问题中表现最佳的算法。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-06-01
    • 1970-01-01
    • 2018-07-28
    • 1970-01-01
    • 2021-04-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多