从图像中提取信息答案

【问题标题】：Extracting Information from Images从图像中提取信息
【发布时间】：2011-02-28 23:30:38
【问题描述】：

有哪些快速且可靠的方法可以提取有关图像的信息？我一直在修补 OpenCV，这似乎是迄今为止最好的路线，而且它有 Python 绑定。

所以更具体地说，我想确定我能对图像中的内容做些什么。因此，例如，哈尔人脸检测和全身检测分类器非常棒——现在我可以判断图像中很可能有人脸和/或人，以及有多少人。

好的 - 还有什么 - 是否有任何建筑物，如果有，它们看起来是什么 - 小屋、办公楼等？是否有可见的天空、草、树等。

从我所读到的关于训练分类器检测对象的文章来看，训练分类器需要 10,000 个左右的错误图像和 5,000 个左右的正确样本，这似乎是一个相当费力的过程。

我希望周围已经有一些像样的东西，而不是必须自己为一堆不同的对象做这件事——或者有其他方法可以解决这类事情吗？

【问题讨论】：

标签： python image opencv identification

【解决方案1】：

如果不进一步说明您正在分析的图像类型和您的目的，您的问题很难回答。

帖子的语气似乎您有兴趣修修补补——这很好。如果您想修改，一个示例应用程序可能是使用小波分析的虹膜识别。您也可以尝试运动跟踪；我已经使用示例项目在 OpenCV 中完成了这项工作，这很有趣。您可以尝试进行图像分割以进行场景分析；拍摄户外照片并根据纹理和/或颜色对图像进行分割。

对于您的训练集必须有多大没有硬性数字。它高度依赖于应用程序。几百张图片就足够了。

【讨论】：

最终，我对自动化描述一组有些相关的图像相关的过程很感兴趣，而无需人工查看它们并说“啊，这些是托斯卡纳度假的一些照片”。虽然这将是非常难以实现的——也许更合理的事情会像好的，这张照片显示了一个葡萄园、一些天空和别墅。
该特定示例包括一个不适定问题。葡萄园、天空和别墅都不是定义明确的对象。甚至“房子”也没有很好的定义。我目前的工作是音乐信息检索；在那里，人们尝试进行流派分类。难度类似：爵士、摇滚、嘻哈和古典都不容易定义。一旦您确定了某种区分类别的定量特征，您的准确性可能会很低。尽管如此，这个困难并没有阻止世界各地的研究人员尝试！
是的，我知道这是一个棘手的问题，但我确信一定有某种方法可以通过训练有素的分类器获得一些有用的信息块——但是从哪里获得它们以及有什么可能。我阅读了一个训练分类器以从不同角度识别碗的示例——这需要一组非常大的“是碗”——“不是碗”图片。
这可能有助于回忆模式识别中的两个基本步骤：特征提取和分类。许多创造力和新颖性在于特征提取。一旦您选择了区分不同类别的特征，您就可以使用许多合适的分类器之一。碗的例子可能受益于测量曲率的东西。（也许是霍夫变换？）我的建议：问问自己什么特征最能区分一个类的对象。 OpenCV 在这里仍然可以提供帮助。祝你好运！