【发布时间】:2019-07-10 03:11:41
【问题描述】:
我正在研究如何从文本中去除背景噪音,我已经知道这些文本会有固定的颜色,但噪音可能会有很大的不同。
例如,我想从图像中删除其余部分,但只保留文本“现在就做!”,我的计划是先对这张图像进行预处理,去除噪点,然后发送处理后的图像要进行 tesseract 进行 OCR,请参见此处的图片:
我是opencv的新手,对opencv有一些基础知识,谁能给我指个方向,让我学习一下?
目前,tesseract 无法从这张图片中检测到任何文字
[from PIL import Image
from pytesseract import *
if __name__ =="__main__":
pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'
print(pytesseract.image_to_string(Image.open('test.png'))) # print nothing here.
【问题讨论】:
-
可以提供图片吗?
-
谢谢@Zhubei-Federer,我没有足够的信用在这里发布图片,但我已经添加了图片链接