pytesseract image_to_string 函数的不相关输出答案

【问题标题】：Unrelated output by pytesseract image_to_string functionpytesseract image_to_string 函数的不相关输出
【发布时间】：2020-10-24 12:18:51
【问题描述】：

我正在尝试从图像中提取文本，但 pytesseract 给出完全不同的输出，输出下方的图像是“Werle”（完全不同的单词和字符），我尝试了许多不同的处理方法，如图像增强、rgb2gray ，rgb2binary，仍然没有工作。让我感到困惑的是，图像中的文字非常清晰明了。我还尝试将笔记本从 google colab 更改为我的本地笔记本并检查库版本，但结果相同。

输出>>“Werle”

这是我的代码：-

ret,frame = cap.read()
crop_img = frame[320:400,430:840]
text = pt.image_to_string(crop_img)

注意：此问题发生在其他具有相同样式但不同单词的图像上

【问题讨论】：

标签： opencv deep-learning computer-vision tesseract cv2

【解决方案1】：

事实证明，Pytesseract 是针对具有白色背景和黑色文本的数据进行训练的，所以我所做的是将黑色像素变为白色，将白色像素变为黑色

    crop_img = frame[320:400,430:840]

    lower_black = np.array([0,0,0], dtype = "uint16")
    upper_black = np.array([200,200,200], dtype = "uint16")
    crop_img = cv2.inRange(crop_img, lower_black, upper_black)

    text = pt.image_to_string(image=crop_img)

并且它在这个预处理中正常工作。

【讨论】：