【发布时间】:2016-10-26 07:51:29
【问题描述】:
我有一个文本图像,其中的单词是轮廓而不是填充的。Tesseract 正在努力使任何单词正确 - 有没有人解决这些类型的问题?
我尝试过像反转这样的简单操作,但没有任何影响。我猜 tesseract 已经解决了这个问题。
图片示例:
Next 的典型输出:New
Previous 的典型输出:Pflevuows
(我的很简单)代码,以图片为参数:
import pytesseract
import sys
from PIL import Image
print(pytesseract.image_to_string(Image.open(sys.argv[1])))
print(sys.argv[1])
编辑:应用threshold binary 可以让我下一个,但似乎还没有上一个。
【问题讨论】:
-
您可以尝试使用 OpenCV 进行 OCR 或分割或预处理(填充轮廓文本,或填充背景并反转图像)。
-
我尝试使用 Floodfill,但 E 和 X 之间的空间没有被捕获。当我尝试反转它时,我没有收到任何文本
-
看起来我想要的东西叫做骨架化。我已经开始阅读opencv,看看它是否有帮助。有人,救救我:(
-
好吧,我已经安装了 OpenCV 和 Python 绑定,但不要指望它。您的问题是否仅限于这种确切的字体?手动填充轮廓时,tesseract 是否正确解码?
-
不,我在 tesseract-ocr 的 git 中发现有一个 pdf doc 表示当前的骨架化方法不可靠。我不知道“当前”是什么时候出现的,但可能有解决方案(我只是还没有找到)。
标签: python opencv python-imaging-library ocr tesseract