【发布时间】:2019-05-29 19:20:12
【问题描述】:
我正在尝试使用 tesseract ocr 将图像转换为文本。图片总是有三个字母,没有旋转/倾斜,而是随机分布在一个 90x50 png 文件中。
通过仅清理并转换为黑白,tesseract 无法获取图像中的文本。在 Paint 中手动对齐它们后,ocr 给出完全匹配。我什至不需要完全对齐。 我想要的是一些关于如何在将图像发送到 tesseract 之前自动对齐图像中字符的提示。
我正在使用带有 tesseract 和 opencv 的 python。
【问题讨论】:
-
您似乎希望我们为您编写一些代码。虽然许多用户愿意为陷入困境的编码人员编写代码,但他们通常只有在发布者已经尝试自己解决问题时才会提供帮助。展示这项工作的一个好方法是包含您迄今为止编写的代码、示例输入(如果有的话)、预期输出以及您实际获得的输出(控制台输出、回溯等)。您提供的详细信息越多,您可能收到的答案就越多。检查FAQ 和How to Ask。
-
这是我为获得您想要的结果而采取的步骤。用于删除背景的阈值图像,这应该会导致您在第二张图像中拥有什么。然后使用 Numpy 创建一个空白的白色图像。接下来找到每个字母的边界框并将 ROI 裁剪到空白图像上。
-
@AustenHolland,谢谢!我是新来的。我已经编写了将第一张图像转换为第二张图像的代码,但我真正要寻找的是 nathancy 给出的答案。我会阅读常见问题解答,并在以后记住您的提示。
标签: python opencv image-processing ocr tesseract