图像数据集是线性可分的吗？答案

【问题标题】：is image dataset linearly separable?图像数据集是线性可分的吗？
【发布时间】：2021-05-09 13:39:17
【问题描述】：

我有 6 个类别的图像数据集（来自 Kaggle 的番茄病）。使用预训练模型vgg16 我提取了特征，然后将它们展平为一维特征向量。之后，我将此向量用作线性核 SVM 分类器的输入。

【问题讨论】：

您好，欢迎来到 StackOverflow。您能否通过提供可以帮助社区回答您的问题的其他信息来改进您的问题。例如代码示例和更详细的问题描述。还有你试过什么？什么有效或无效？
谢谢@Cninroh 抱歉我无法提供代码，但在这里我做了什么（使用预训练模型 vgg16 我已经提取了特征然后这些特征我只是将它们展平为一维特征向量，然后我使用了这个向量作为我的线性核支持向量机分类器的输入）这就是我想要做的）

标签： svm

【解决方案1】：

首先问题：

但是，如果您有两个以上的功能，则难以可视化可分离性。一种方法是Cherkassky，Vladimir＆Dhar，Sauptik（2010）中的预测分析或单变量直方图：

第二问题：

在第一次瞥见，是的，但不幸的是你没有提供你的结果。

就像一个旁边。具有线性内核的SVM是能够对非线性数据进行分类的唯一线性模型，因为SVM在更高（可能的信息）维度中实现了线性单位性。

【讨论】：

【解决方案2】：

通常不是您的图像直接“线性可分”，它们是您从可线性可分的图像中提取的特征所产生的点。

这些功能可以看作是应用于原始图像的内核，将图像投影到空间中。在这最后一个空间中，对应于图像的数据点可以是线性可分的，在这种情况下，具有线性核的 SVM 将是最佳选择。

因此，这实际上取决于您从图像中提取的特征，以及如何将它们表示为 SVM 的输入。当您使用（或多或少）神经网络时，N-1 第一层可以被视为特征提取器（即参数化内核），最后一层是应用于结果表示空间的线性鉴别器（在你期望数据是线性可分的）

【讨论】：