【发布时间】:2020-07-29 19:23:32
【问题描述】:
我正在尝试找到一种方法,从所附图片中筛选出字母和数字(主要是数字)。
在之前的尝试中,我使用了 pyocr 和许多其他变体。
我的问题是,有没有人找到一种方法来刮掉数字?或者如何训练pyocr算法使用自定义数据?
提前致谢!
【问题讨论】:
标签: python ocr python-tesseract
我正在尝试找到一种方法,从所附图片中筛选出字母和数字(主要是数字)。
在之前的尝试中,我使用了 pyocr 和许多其他变体。
我的问题是,有没有人找到一种方法来刮掉数字?或者如何训练pyocr算法使用自定义数据?
提前致谢!
【问题讨论】:
标签: python ocr python-tesseract
PyImageSearch 的人们有大量关于在 Python 中使用 OpenCV 处理图像的信息。
他们甚至有一篇关于使用 Tesseract OCR 的免费博客文章。虽然 Tesseract 对字体可能有点挑剔,但好消息是图像中的文本看起来应该始终使用相同的字体,并且水平和垂直对齐。
(免责声明:我是他们的学生;但我不为他们工作) https://www.pyimagesearch.com/2018/09/17/opencv-ocr-and-text-recognition-with-tesseract/
【讨论】: