如何在清晰的图像上改善 tesseract ocr 结果？答案

【问题标题】：How to improve tesseract ocr results on a clear image?如何在清晰的图像上改善 tesseract ocr 结果？
【发布时间】：2020-04-18 14:37:29
【问题描述】：

我已经从源代码编译了 tesseract 5.0.0-alpha，并尝试了所有不同的页面分割模式。我事先知道实际字体是用字体 DejaVu Sans Mono 编写的，所以我用这个字体（maxpages = 600）训练了模型，最终生成了模型。

但由于某种原因 tesseract 未命中。例如，这是一个经过预处理后的简单图像：

但我总是得到错误的值，字母 l 被数字 1 取代。数字 6 到字母 l 之间的实际空格被忽略/消失。谁能给我一些建议？

谢谢大家，我非常感谢任何帮助！

【问题讨论】：

标签： ocr tesseract

【解决方案1】：

我正在使用带有 tesseract 版本 5 的 Ubuntu 18.04。我使用以下命令并得到了正确的结果。也许您可以尝试相同的命令。

tesseract HfUmN.jpg stdout -l eng --oem 3 --psm 7 -c tessedit_char_whitelist="abcdefghijklmnopqrstuvwxyz0123456789=[], "
Warning: Invalid resolution 0 dpi. Using 70 instead.
6 l1 = [1, 2, 4, 5]

tesseract --version
tesseract 5.0.0-alpha-647-g4a00
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE
 Found OpenMP 201511
 Found libarchive 3.2.2 zlib/1.2.11 liblzma/5.2.2 bz2lib/1.0.6 liblz4/1.7.1

【讨论】：

有趣的原因是我得到了不同的结果：611 =[1, 2, 4, 5] 我现在用 github 上发布的原始模型 eng.traineddata 进行了检查，怎么会这样？唯一不同的是我使用的是 leptonica-1.75.3，tesseract 5.0.0-alpha-648-gcdebe 和相同的 Ubuntu 版本。
有时 tesseract 会给出不同的结果。我不知道内部工作。