【问题标题】:Pytesseract OCR not returning proper result on captcha imagePytesseract OCR 未在验证码图像上返回正确结果
【发布时间】:2020-01-15 12:50:08
【问题描述】:

我正在使用 tesseract 4.0.0-beta.1

我有以下图片

ocr image

我已使用 opencv 转换此图像

converted image

img = cv2.imread(image, cv2.IMREAD_GRAYSCALE)
img = cv2.resize(img, None, fx=5, fy=5, interpolation=cv2.INTER_LINEAR)
img = cv2.medianBlur(img, 9)
_, img = cv2.threshold(img, 185, 255, cv2.THRESH_BINARY)

我的 tesseract 推荐

tesseract image.png stdout -l eng-best --oem 1 --psm 7

得到结果:NVRG nk

但结果应该是:nvRGnk

【问题讨论】:

    标签: python opencv ocr tesseract python-tesseract


    【解决方案1】:

    从转换后的图像开始,只需要多一点过滤

    nvRGnk

    import cv2
    import pytesseract
    
    pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
    
    image = cv2.imread('2.png',0)
    image = 255 - image
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
    close = cv2.morphologyEx(image, cv2.MORPH_CLOSE, kernel, iterations=2)
    dilate_kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (2,2))
    dilate = cv2.dilate(close, dilate_kernel, iterations=1)
    result = 255 - dilate 
    
    data = pytesseract.image_to_string(result, lang='eng',config='--psm 13')
    print(data)
    
    cv2.imshow('result', result)
    cv2.waitKey()
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-01-15
      • 1970-01-01
      • 2019-11-02
      • 1970-01-01
      • 2017-06-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多