【问题标题】:How to improve tesseract ocr results on a clear image?如何在清晰的图像上改善 tesseract ocr 结果?
【发布时间】:2020-04-18 14:37:29
【问题描述】:

我已经从源代码编译了 tesseract 5.0.0-alpha, 并尝试了所有不同的页面分割模式。 我事先知道实际字体是用字体 DejaVu Sans Mono 编写的, 所以我用这个字体(maxpages = 600)训练了模型,最终生成了模型。

但由于某种原因 tesseract 未命中。例如,这是一个经过预处理后的简单图像:

但我总是得到错误的值,字母 l 被数字 1 取代。 数字 6 到字母 l 之间的实际空格被忽略/消失。 谁能给我一些建议?

谢谢大家, 我非常感谢任何帮助!

【问题讨论】:

    标签: ocr tesseract


    【解决方案1】:

    我正在使用带有 tesseract 版本 5 的 Ubuntu 18.04。我使用以下命令并得到了正确的结果。也许您可以尝试相同的命令。

    tesseract HfUmN.jpg stdout -l eng --oem 3 --psm 7 -c tessedit_char_whitelist="abcdefghijklmnopqrstuvwxyz0123456789=[], "
    Warning: Invalid resolution 0 dpi. Using 70 instead.
    6 l1 = [1, 2, 4, 5]
    
    tesseract --version
    tesseract 5.0.0-alpha-647-g4a00
     leptonica-1.78.0
      libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
     Found AVX2
     Found AVX
     Found FMA
     Found SSE
     Found OpenMP 201511
     Found libarchive 3.2.2 zlib/1.2.11 liblzma/5.2.2 bz2lib/1.0.6 liblz4/1.7.1
    

    【讨论】:

    • 有趣的原因是我得到了不同的结果:611 =[1, 2, 4, 5] 我现在用 github 上发布的原始模型 eng.traineddata 进行了检查,怎么会这样?唯一不同的是我使用的是 leptonica-1.75.3,tesseract 5.0.0-alpha-648-gcdebe 和相同的 Ubuntu 版本。
    • 有时 tesseract 会给出不同的结果。我不知道内部工作。
    猜你喜欢
    • 1970-01-01
    • 2019-01-28
    • 1970-01-01
    • 1970-01-01
    • 2015-03-07
    • 2016-06-02
    • 1970-01-01
    • 1970-01-01
    • 2014-10-30
    相关资源
    最近更新 更多