【发布时间】:2015-06-26 01:31:38
【问题描述】:
我正在进行一个涉及 OCR 的项目。检测到每个字符后,我需要结合紧密的字符来创建单词。为此,我尝试创建一个优先级队列,其中包含有关检测到的字符的信息(形成字符的像素集和字符在文档图像上的位置),并为文档顶部的字符赋予更高的优先级,并且更高的优先级如果两个字符在同一行,则到最左边的字符。然后依次轮询优先队列中的字符,希望它能给我从左到右和从上到下的所有字符,并根据每两个后续字符之间的空间构建单词。当文档稍微倾斜时实际上失败了,因为一些明显在人眼同一行的字符不一定在相同的像素高度(阈值为 5~10px)。
有没有自动拉直文档的算法?或检测倾斜角度?或者任何图书馆?或者如果没有,有没有办法解决这个问题?这是我最后一年的项目,我没有多少时间来解决这个问题。请帮忙。谢谢。
【问题讨论】:
-
您使用哪种 OCR 引擎?
-
@ipoteka - 没有,我应该训练一个神经网络来识别字符,然后使用该网络来识别文档上的字符。我使用 Encog 来实现反向传播神经网络。
标签: algorithm computer-vision artificial-intelligence ocr document