【问题标题】:Unrelated output by pytesseract image_to_string functionpytesseract image_to_string 函数的不相关输出
【发布时间】:2020-10-24 12:18:51
【问题描述】:

我正在尝试从图像中提取文本,但 pytesseract 给出完全不同的输出,输出下方的图像是“Werle”(完全不同的单词和字符),我尝试了许多不同的处理方法,如图像增强、rgb2gray ,rgb2binary,仍然没有工作。让我感到困惑的是,图像中的文字非常清晰明了。我还尝试将笔记本从 google colab 更改为我的本地笔记本并检查库版本,但结果相同。

输出>>“Werle”

这是我的代码:-

ret,frame = cap.read()
crop_img = frame[320:400,430:840]
text = pt.image_to_string(crop_img)

注意:此问题发生在其他具有相同样式但不同单词的图像上

【问题讨论】:

    标签: opencv deep-learning computer-vision tesseract cv2


    【解决方案1】:

    事实证明,Pytesseract 是针对具有白色背景和黑色文本的数据进行训练的,所以我所做的是将黑色像素变为白色,将白色像素变为黑色

        crop_img = frame[320:400,430:840]
    
        lower_black = np.array([0,0,0], dtype = "uint16")
        upper_black = np.array([200,200,200], dtype = "uint16")
        crop_img = cv2.inRange(crop_img, lower_black, upper_black)
    
        text = pt.image_to_string(image=crop_img)
    

    并且它在这个预处理中正常工作。

    【讨论】:

      猜你喜欢
      • 2023-03-16
      • 1970-01-01
      • 2020-09-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多