【发布时间】:2017-07-22 19:43:55
【问题描述】:
我正在尝试使用 Tesseract OCR v3.2 来识别计算机屏幕上的字符,但使用某种低分辨率字体给我带来了很多麻烦,尤其是在涉及数字时。字体看起来像this。我目前正在将输入图像通过 Python 中的双三次滤波器通过 4 倍放大,这导致它们看起来像 this。 Tesseract 将处理后的图像读取为“12345B?89D”。
我尝试了各种其他高档比率(最高 1000%),以及其他图像过滤器,如 lanczos、锐化、平滑、边缘增强和抗锯齿。没有一个产生更准确的结果。有人对如何提高对该字体的识别度有任何想法吗?
【问题讨论】:
-
好吧,imgur 网站给出了一只死去的长颈鹿,然后在重试放大的图像时出现了 503,所以我真的不能因为没有得到这个而责怪 Tesseract。同时——在没有对图像预处理有用的反馈的情况下,你可以看看为 Tesseract 生成一个训练文件并使用它(那里有几个免费的编辑器)。另外:你确定你通过 Tesseract 灰度图像格式(不是 RGB 或 BGR)?
标签: python fonts ocr tesseract resolution