【问题标题】:Why does pytesseract fail to recognize digits in this simple image?为什么 pytesseract 无法识别这个简单图像中的数字?
【发布时间】:2019-01-01 20:26:33
【问题描述】:

我正在尝试使用 pytesseract 从图像中识别两个数字:

  • 我试过--psm 610
  • 我试过-c tessedit_char_whitelist=0123456789'

以上都不返回49 号码。我得到的最接近的是返回4 没有9

你有什么技巧可以让tesseract识别吗?

【问题讨论】:

    标签: python ocr tesseract python-tesseract


    【解决方案1】:

    试试--psm 13 --oem 3oem = 1 或 2 也应该这样做)

    import pytesseract
    from PIL import Image
    import requests
    import io
    
    response = requests.get('https://i.stack.imgur.com/oAAXR.png')
    text = pytesseract.image_to_string(Image.open(io.BytesIO(response.content)), lang='eng',
                        config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')
    
    print(text)
    

    在我的机器上产生 49,正如你所期望的那样。

    我通过在本地下载图像并触发得到相同的结果

    tesseract oAAXR.png output --oem 3 --psm 13 -l eng
    

    作为参考,我的tesseract --version 给出了 tesseract 4.0.0 leptonica-1.77.0 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 2.0.1) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.1 Found AVX2 Found AVX Found SSE

    【讨论】:

    • --psm 13 记录在哪里?我这里只看到 1-10:TESSERACT(1) Manual Page.
    • 哦,看起来他们的文档可能不一致或引用了不同的版本,请检查 github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage 以获取 psm > 10。
    • 感谢您的回答,但您的代码给了我“ay”字符串而不是 49。tesseract 版本:tesseract 4.0.0 leptonica-1.77.0 libgif 5.1.4:libjpeg 9c:libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.1 : libopenjp2 2.3.0 找到 AVX2 找到 AVX 找到 SSE 我也在使用 MacOS (Mojave)。也许这与它有关
    • 我已经用我的配置编辑了答案,不知道可能出了什么问题:(
    • 是的,我可以看到唯一的区别是:你的 libjpeg 是 8d,而我的 libjpeg 是 9c。其他一切都一样。
    【解决方案2】:

    你试过不同的--oem 吗?我也会尝试使用大于 10 的--psm

    【讨论】:

      【解决方案3】:

      对我来说,以下命令只返回4

      tesseract oAAXR.png out --dpi 300 --psm 11 --oem 1 -c tessedit_char_whitelist=0123456789
      

      使用:

      tesseract 4.1.1-rc2-17-g6343
       leptonica-1.76.0
        libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
       Found AVX2
       Found AVX
       Found FMA
       Found SSE
       Found libarchive 3.3.3 zlib/1.2.11 liblzma/5.2.4 bz2lib/1.0.6 liblz4/1.8.3 libzstd/1.3.8
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2021-11-14
        • 1970-01-01
        • 1970-01-01
        • 2019-09-23
        • 1970-01-01
        • 1970-01-01
        • 2021-03-30
        相关资源
        最近更新 更多