【问题标题】:Tesseract not detecting lettersTesseract 未检测到字母
【发布时间】:2018-08-08 14:10:21
【问题描述】:

我正在尝试对这张图片进行 OCR:

使用 Python Tesseract(pytesseract) 但除了空行之外我没有得到任何输出,我认为这意味着它没有检测到任何字母。

我使用的代码是这样的:

name = pytesseract.image_to_string(imo, lang='eng', config='--psm 13')

我在 Ubuntu 18.04.1 LTS 上使用 python 3.6.5 和 tesseract 4.0.0-beta.1

【问题讨论】:

  • 为图像添加白色边框,然后将其传递给 tesseract 并查看结果
  • 我刚试过,但现在它给出了 A 作为输出
  • 在发送到teseract之前对其进行二值化...使用otsu
  • 反向?因为我之前已经对其进行了二值化
  • 你能检查你的命令行'tesseract $image $outbase -psm 10'

标签: python tesseract


【解决方案1】:

步骤应该是

第 1 步 - 为图像添加额外的白色边框

第 2 步 - 使用 otsu 或其他方法对其进行二值化以获得最佳二值化效果

第 3 步 - 然后使用 psm 10(对于单个字符)将其发送到 tesseract

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-01-06
    • 2018-09-07
    • 1970-01-01
    • 1970-01-01
    • 2018-08-26
    • 1970-01-01
    • 2021-12-28
    相关资源
    最近更新 更多