【发布时间】:2012-09-05 07:36:30
【问题描述】:
我正在从事一个项目,其中我的图像文件格式错误(模糊,即它们的图像数据已被更改)。这些文件在各种平台上呈现时会导致来自平台的警告/崩溃/通过报告。
我正在尝试使用无监督机器学习构建一个防护罩,这将帮助我将这些图像识别/分类为恶意或非恶意图像。我有这些文件的二进制数据,但我不知道我可以从中识别出哪些特征集/模式,因为从视觉上看,这些图像可能是任何东西。 (我需要能够从二进制数据中找到特征集)
我需要一些关于可用于从该二进制数据中自动提取特征的工具/方法的建议;我可以将其与无监督学习算法(如 Kohenen 的 SOM 等)一起使用。
我是新手,任何帮助都会很棒!
【问题讨论】:
-
图像的二进制数据是什么意思?如果您可以查看图像,那么您可以检索作为特征所需的每个像素的值。
标签: validation machine-learning file-format feature-extraction fuzzing