【问题标题】:is image dataset linearly separable?图像数据集是线性可分的吗?
【发布时间】:2021-05-09 13:39:17
【问题描述】:

我有 6 个类别的图像数据集(来自 Kaggle 的番茄病)。使用预训练模型vgg16 我提取了特征,然后将它们展平为一维特征向量。之后,我将此向量用作线性核 SVM 分类器的输入。

  1. 如何测试我的图像数据集是否线性可分?
  2. 在 SVM 分类器中应用不同的内核我得到了线性内核的最佳结果,这是否意味着我的图像数据集是线性可分的?

【问题讨论】:

  • 您好,欢迎来到 StackOverflow。您能否通过提供可以帮助社区回答您的问题的其他信息来改进您的问题。例如代码示例和更详细的问题描述。还有你试过什么?什么有效或无效?
  • 谢谢@Cninroh 抱歉我无法提供代码,但在这里我做了什么(使用预训练模型 vgg16 我已经提取了特征然后这些特征我只是将它们展平为一维特征向量,然后我使用了这个向量作为我的线性核支持向量机分类器的输入)这就是我想要做的)

标签: svm


【解决方案1】:

首先问题:

但是,如果您有两个以上的功能,则难以可视化可分离性。一种方法是Cherkassky,Vladimir&Dhar,Sauptik(2010)中的预测分析或单变量直方图:

第二问题:

在第一次瞥见,是的,但不幸的是你没有提供你的结果。

就像一个旁边。具有线性内核的SVM是能够对非线性数据进行分类的唯一线性模型,因为SVM在更高(可能的信息)维度中实现了线性单位性。

【讨论】:

  • 你的最后一句关于线性内核的最后一句没有意义,svm是一个线性模型,并且用线性内核,它只能正确分类线性可分离的数据。 span>
  • @ dr.snoopy是svm中的内核技巧准确地说,是关于制作非线性可占用数据的线性设置?喜欢这里:qph.fs.quoracdn.net/… span>
  • 确定但使用线性内核与不使用任何内核技巧完全相同,您需要使用非线性内核来获得非线性行为。 span>
  • 是的,你不能,如果它被接受,你就没有理由删除答案。 span>
【解决方案2】:

通常不是您的图像直接“线性可分”,它们是您从可线性可分的图像中提取的特征所产生的点。

这些功能可以看作是应用于原始图像的内核,将图像投影到空间中。在这最后一个空间中,对应于图像的数据点可以是线性可分的,在这种情况下,具有线性核的 SVM 将是最佳选择。

因此,这实际上取决于您从图像中提取的特征,以及如何将它们表示为 SVM 的输入。当您使用(或多或少)神经网络时,N-1 第一层可以被视为特征提取器(即参数化内核),最后一层是应用于结果表示空间的线性鉴别器(在你期望数据是线性可分的)

【讨论】:

  • “它们是您从图像中提取的线性可分特征所产生的点。”总结得很好。感谢您的洞察力。
  • 谢谢@xiawi 是否有任何方法可以帮助可视化了解我的数据集是如何分离的?如果你知道,你能推荐他们吗)
  • @nadersalah 我在回答中为您提供了两种可视化方法。我会很感激“接受”。不要犹豫,要求澄清
  • @Epimetheus 感谢您的回复)感谢)
猜你喜欢
  • 2019-10-22
  • 2019-09-11
  • 2015-12-29
  • 2016-12-31
  • 1970-01-01
  • 1970-01-01
  • 2017-07-11
  • 2015-07-20
  • 2019-01-11
相关资源
最近更新 更多