【问题标题】:Tuning tesseract command line to OCR prices将 tesseract 命令行调整为 OCR 价格
【发布时间】:2015-03-20 23:08:31
【问题描述】:

我有一些带有价格的小图片,如下所示:

但是当我尝试命令时得到一个空的输出文件:

tesseract image.png output.txt

我应该使用什么特殊命令来 OCR 像这样的小图像?另外,我可以指定可能的结果只有一个美元符号、一个句点和数字 0-9 吗?

我已经尝试通过添加到配置文件中的“字母”方法,但我没有找到任何关于是否需要转义美元符号或句点的数据。无论如何,我使用上面命令的简单版本得到零响应。

【问题讨论】:

    标签: windows ocr tesseract


    【解决方案1】:

    您使用的是什么版本的 tesseract?使用以下命令:

    tesseract image.png 输出 -psm 8

    我得到了这个结果。

    12705 美元

    请注意,缺少点。您也可以通过使用膨胀算法对图像进行预处理来获得点。

    版本信息: 正方体 3.03.00(Windows 7) leptonica-1.70(2014 年 8 月 5 日,21:29:11)[MSC v.1800 DLL 版本 x86] libgif 4.1.6(?):libjpeg 8c:libpng 1.4.3:libtiff 3.9.4:zlib 1.2.8

    【讨论】:

    • 我会找那个版本的。我仍然一无所获,我的版本是 tesseract 3.02 leptonica-1.68(2011 年 3 月 14 日,10:43:03)[MSC v.1500 LIB 版本 32 位] libgif 4.1.6:libjpeg 8c:libpng 1.4.3: libtiff 3.9.4:zlib 1.2.5。
    • 你从哪里得到的那个版本。谷歌代码页只有 3.02
    • 3.0.3 是 Tesseract 的候选版本。我只设法编译了 Tesseract.exe,并复制了它并覆盖了现有版本。使用 3.0.2 运行相同的命令时,我也没有得到任何输出。如果您自己编译 3.0.3 有困难,请告诉我。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-01-27
    • 1970-01-01
    • 2014-12-02
    • 1970-01-01
    • 2017-11-13
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多