【发布时间】:2013-10-07 10:56:25
【问题描述】:
我目前正在开发 OCR 软件,我的想法是使用模板来尝试识别发票中的数据。
但是扫描的发票可能有几个“缺陷”:
- 并非所有基于单一模板的发票都在扫描仪下正确对齐。
- 人们可以在发票上写字
- 等
发票示例:(必须谷歌它,遗憾的是无法添加更具体的版本,因为客户数据显然是机密的)
我根据文本的 x 值在发票中找到我的数据。
但是,我需要知道发票的比例和从左/右的偏移量,然后才能对检索到的所有数据进行任何实际计算。
到目前为止我尝试了什么?
1) 使图像成为单色并使用第一个出现的黑色像素的左右边界。这失败了,因为人们可以在发票上写字。
2) 将发票分成垂直部分,使用黑色像素最多的部分。由于相似模板之间的分布并不总是一致的事实而失败。
我真的可以在 (1) 如何识别发票中的重点和 (2) 我应该关注的重点方面提供帮助。
我希望这个问题足够清楚,因为它很难解释。
【问题讨论】:
-
您可以依赖发票的哪些固定部分?表格本身,特别是它的黑框,会在所有扫描中使用吗?灰色背景是否也可以使用,或者它们会在某些扫描中丢失?即使应该旋转图像以进行扫描,比例是否相同,或者您是否也期望比例变化?
-
您使用什么样的技术在表格中定位描述和编号?
标签: image algorithm ocr invoice