【发布时间】:2012-12-09 14:54:37
【问题描述】:
问题
我一直在构建一个(非常)简单的 OCR 引擎。 由于我试图对非常小的(像素大小)字符进行分类,因此在分割时遇到了一些困难。下面是一个示例,经过尽力而为的图像范围阈值处理:
:
我尝试过的
错误检测:
- 段的水平尺寸过大。它主要是有效的,但失败了(误报) 对于一些较大的字符。
- 分类,并拒绝低分。这似乎有点浪费。
错误更正:
- 垂直添加像素(垂直直方图),找到最小值。在许多样本中,它在错误的位置切割了许多片段。
我还没有尝试过的东西
- 尝试对所有可能的分割点(像素)进行分类。这将非常浪费,并且难以扩展为 3 个合并字符的片段。
- 我一直在阅读 morphology approaches 以将字符转换为数学曲线,但我真的不知道从哪里开始,或者是否值得努力
从这里到哪里去?
我不知道。因此这个问题:)
【问题讨论】:
标签: opencv image-processing language-agnostic ocr image-segmentation