【问题标题】:How to detect simple text with Tesseract ORC?如何使用 Tesseract OCR 检测简单文本?
【发布时间】:2016-01-12 16:26:24
【问题描述】:

我正在尝试使用https://github.com/tesseract-ocr/tesseract 将带有数字的简单图像转换为文本。我使用 Leptonica 和图像处理所需的其他库从 github 编译了最新版本。

我的图像如下所示:

我正在尝试像这样转换它:/usr/local/bin/tesseract '/home/var/img2text/phone.png' out,而不是像3m mam 这样的数字。可能是什么问题呢?

【问题讨论】:

    标签: tesseract linux-mint leptonica


    【解决方案1】:

    图片很小,画质有点低,试试下面的:

    1- 将其 DPI 更改为 300

    2- 将图像大小调整 2 倍并应用重新采样插值。

    3- 确保它是黑白图像。

    这里有一些有用的链接:

    https://code.google.com/p/tesseract-ocr/wiki/ImproveQuality

    image processing to improve tesseract OCR accuracy

    【讨论】:

      猜你喜欢
      • 2014-04-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多