【发布时间】:2012-12-24 18:59:22
【问题描述】:
我正在寻找一个 Python 或 C++ 库,它可以在图像中查找字符并返回这些字符的位置和边界框。如果库恰好有包含示例的文档,这是一个加分项。
图书馆能否识别单词并不重要。
这些字符是非混淆的,并且是简单的字体,例如 Arial。
【问题讨论】:
-
是图片吗?如果没有,那么您可以简单地渲染 Arial 字符并在图像中找到它(提示:PIL 是一个图像处理库)。
-
python-tesseract 是 Google 的 Tesseract OCR 库的 Python 包装器。但是,我不确定它是否提供对边界框和类似内容的访问。
-
@user176581,恐怕是图像。有一些简单的背景颜色不应该使查找字母的任务过于复杂,但会使简单的方法令人沮丧。
-
@Richard 那么也许您可以使用我描述的相同方法,但允许存在细微差异。
-
@Richard 你能发布一些你将要处理的有代表性的图片吗?简单的背景色是指简单的单一纯色,但可能会受到噪声(即即使眼睛认为它们是相同的颜色,但由于噪声而它们并不完全相同)、图案或类似于 CAPTCHA 的东西的影响?另外,您的角色是否都具有相同的字体大小和字体等?还是它们混合在一起?
标签: c++ python image-recognition