【发布时间】:2019-10-15 12:22:50
【问题描述】:
我正在做一个项目,我想从信用卡大小的文档中识别文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像并将图像传递给 tesseract 引擎使用
text = pytesseract.image_to_string(Image.open(filename), lang = 'eng')。有时我在每个领域都得到了不错的结果,但大多数时候结果很糟糕。我该如何解决这个问题?什么是最佳实践。文档阅读器如何使用 OCR。是否可以在文档中处理基于区域的ocr?
【问题讨论】:
标签: machine-learning computer-vision ocr tesseract python-tesseract