【发布时间】:2020-12-08 15:25:27
【问题描述】:
我正在尝试使用 pytesseract 读取并获取黑色背景上白色文本的位置,但没有任何成功。这是我正在处理的图像示例。
代码如下:
import cv2
import pytesseract
from pytesseract import Output
img = cv2.imread("ocr_example.png")
img = cv2.bitwise_not(img)
_, binary = cv2.threshold(img, 150, 255, cv2.THRESH_BINARY)
custom_config = r'--oem 3 --psm 6'
d = pytesseract.image_to_data(binary, output_type=Output.DICT, config=custom_config)
print(d["text"])
这是找到的文本的输出:
['', '', '', '', '家', '地址', '', '使用', '当前', '位置', '', '>', '', '无法'、'到'、'查找'、'位置']
如果我将黑色背景上的白色文本保存到它自己的文件中并扫描,则可以毫无问题地找到文本。但是我需要获取整个图像上文本的位置。
我已尝试在 https://nanonets.com/blog/ocr-with-tesseract/ 等网站上使用许多预处理建议,但似乎没有任何效果。我不介意进行第二次搜索,只找到丢失的文本。
【问题讨论】:
标签: ocr python-tesseract