【发布时间】:2015-03-20 23:08:31
【问题描述】:
我有一些带有价格的小图片,如下所示:
但是当我尝试命令时得到一个空的输出文件:
tesseract image.png output.txt
我应该使用什么特殊命令来 OCR 像这样的小图像?另外,我可以指定可能的结果只有一个美元符号、一个句点和数字 0-9 吗?
我已经尝试通过添加到配置文件中的“字母”方法,但我没有找到任何关于是否需要转义美元符号或句点的数据。无论如何,我使用上面命令的简单版本得到零响应。
【问题讨论】:
我有一些带有价格的小图片,如下所示:
但是当我尝试命令时得到一个空的输出文件:
tesseract image.png output.txt
我应该使用什么特殊命令来 OCR 像这样的小图像?另外,我可以指定可能的结果只有一个美元符号、一个句点和数字 0-9 吗?
我已经尝试通过添加到配置文件中的“字母”方法,但我没有找到任何关于是否需要转义美元符号或句点的数据。无论如何,我使用上面命令的简单版本得到零响应。
【问题讨论】:
您使用的是什么版本的 tesseract?使用以下命令:
tesseract image.png 输出 -psm 8
我得到了这个结果。
12705 美元
请注意,缺少点。您也可以通过使用膨胀算法对图像进行预处理来获得点。
版本信息: 正方体 3.03.00(Windows 7) leptonica-1.70(2014 年 8 月 5 日,21:29:11)[MSC v.1800 DLL 版本 x86] libgif 4.1.6(?):libjpeg 8c:libpng 1.4.3:libtiff 3.9.4:zlib 1.2.8
【讨论】: