【问题标题】:What is a good method to find all occurrences of a specific letter in an image?找到图像中特定字母的所有出现的好方法是什么?
【发布时间】:2011-05-22 03:32:20
【问题描述】:

例如,在 .png 中找到所有 A 的位置,无论比例如何,但都正确旋转?

编辑:那些说这是一个比我想象的更困难的问题的人是正确的。我想添加一些细节;我正在寻找一种方法来从(黑白扫描的手写图像)中找到字母的位置,或者只给出字母的图像,找到它的 A-ness(WRT 某种字体) .

我意识到这是一个大型项目,所以我想知道是否有任何开源库可以做这样的事情,或者一个简单的算法。我尝试了一些角落匹配方案,但没有成功。

【问题讨论】:

  • 什么字体?抗锯齿字符?有色?背景?亚像素平滑?最小和最大高度(以像素为单位)?我们需要更多信息。正确的选择取决于这些特征。也许与预定义的参考字母匹配的简单模式会做到这一点(在目标字符/图像的分割和规范化之后)。或者您需要提取几何特征而不仅仅是像素信息。可以写一篇关于这些问题的博士论文……
  • 最好的方法还是手动搜索。好吧,不完全是手动的,我的意思是用你的眼睛。除非它们是盲文字母。

标签: image-processing computer-vision pattern-recognition


【解决方案1】:

首先,您的问题属于计算机视觉领域(不是图像处理,尽管对于初学者来说可能看起来如此)。然后,png图像是自然场景的照片还是扫描文档会产生很大的不同。在自然图像的情况下,您需要检查一般对象检测或特别是文本检测方面的文献。对于扫描的文档,您的领域是文档分析(或文档处理)。

无论如何,我认为您的问题可能是可以解决的,尽管解决方案可能比您愿意坚持的更远(在努力和时间上)。

【讨论】:

  • 我更新了我的问题,我担心你可能是正确的关于比我想要的更远。
  • 只是出于好奇:为什么这个问题不应该属于图像处理领域?图像识别(也是字符识别)和图像分割肯定是图像处理的一部分......它们一起属于计算机视觉领域,其中包括更多......至少这是我们的教授教给我们的...但请随时纠正我...
【解决方案2】:

一个很好的方法是使用 NGC(非灰度相关)和您的“A”作为模型。问题是这不是尺度不变的方法。事实上,这个问题可能非常复杂。要解决多个比例,您可以为每个比例和循环生成模型(慢)。

【讨论】:

  • 我认为我不会遇到任何大于 64x64 像素的东西,我会调查一下。谢谢!
猜你喜欢
  • 2010-12-06
  • 1970-01-01
  • 2010-09-23
  • 1970-01-01
  • 1970-01-01
  • 2013-05-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多