【发布时间】:2016-02-21 05:29:10
【问题描述】:
我正在尝试为移动设备开发 OCR 应用程序。
因此,在将其传递给 OCR 引擎之前,我会应用一些过滤器并对图像进行二值化以获得更好的结果。
我正在使用自适应高斯阈值,这给了我很好的结果,但文本周围还有一些点和噪声(如下图所示),这会导致 OCR 输出错误。
我理解的原因是因为文本周围的白色轮廓只有在我显着放大图像时才能观察到:
我尝试通过在对其进行二值化之前应用高斯模糊来最小化它。但我仍然相信,如果我能理解并消除文本周围白色轮廓的原因,我可以获得更好的结果。
我还添加了images 我已经以他们的名义解释了图像的细节。
我得到了很好的结果,但只是想获得更多的见解,并尝试探索是否有任何其他或更好的方法来实现同样的目标。
任何指导或方向都会有很大帮助。 我希望我的问题很清楚。请随时询问任何详细信息。
谢谢。
【问题讨论】:
-
白色轮廓用于增强文本的视觉外观(例如,如果背景是图像)...找到平均背景颜色(角)并将所有像素设置为比应该删除的颜色更亮的像素白色和保留字符不变
-
那么,移动端是否在内部增强了图像的可读性?好吧,我能够使用高斯模糊在很大程度上消除,然后应用具有更大内核大小(准确地说是 15)的自适应高斯阈值,我能够获得良好的结果。
标签: opencv image-processing ocr