【问题标题】:Python/C++ library to find location of characters in image用于查找图像中字符位置的 Python/C++ 库
【发布时间】:2012-12-24 18:59:22
【问题描述】:

我正在寻找一个 Python 或 C++ 库,它可以在图像中查找字符并返回这些字符的位置和边界框。如果库恰好有包含示例的文档,这是一个加分项。

图书馆能否识别单词并不重要。

这些字符是非混淆的,并且是简单的字体,例如 Arial。

【问题讨论】:

  • 是图片吗?如果没有,那么您可以简单地渲染 Arial 字符并在图像中找到它(提示:PIL 是一个图像处理库)。
  • python-tesseract 是 Google 的 Tesseract OCR 库的 Python 包装器。但是,我不确定它是否提供对边界框和类似内容的访问。
  • @user176581,恐怕是图像。有一些简单的背景颜色不应该使查找字母的任务过于复杂,但会使简单的方法令人沮丧。
  • @Richard 那么也许您可以使用我描述的相同方法,但允许存在细微差异。
  • @Richard 你能发布一些你将要处理的有代表性的图片吗?简单的背景色是指简单的单一纯色,但可能会受到噪声(即即使眼睛认为它们是相同的颜色,但由于噪声而它们并不完全相同)、图案或类似于 CAPTCHA 的东西的影响?另外,您的角色是否都具有相同的字体大小和字体等?还是它们混合在一起?

标签: c++ python image-recognition


【解决方案1】:

我不知道有一个标准库可以做到这一点。不过,这类任务有各种论文和示例:基本上,您需要对图像进行一些预处理以查找文本,然后确定边界框。例如,请参阅 this stackoverflow thread 了解某些内容。

OpenCV 等库可能有助于实现这一点。

【讨论】:

    猜你喜欢
    • 2020-09-05
    • 1970-01-01
    • 2019-09-22
    • 2012-08-03
    • 2012-12-24
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多