【发布时间】:2017-01-16 06:30:38
【问题描述】:
我正在从事一个项目,我必须从图像中读取文档。在最初阶段,我会阅读机器打印的文件,然后最终转向手写文件的图像。但是我这样做是为了学习目的,所以我不打算使用像 Tesseract 等这样的 api。 我打算分步做:
预处理(模糊、阈值化、侵蚀和膨胀)
字符分割
OCR(或后期的 ICR)
所以我现在正在做字符分割,我最近通过水平和垂直直方图做了。对于某些字体,我无法获得非常好的结果,例如所示的图像,我无法获得良好的结果。
还有其他方法或算法可以做到这一点吗? 任何帮助将不胜感激!
编辑 1:
【问题讨论】:
标签: python opencv image-processing ocr