【发布时间】:2015-08-19 07:25:26
【问题描述】:
我有兴趣涉足 Python 和机器学习/自动数据输入。然而,随着我的研究进展,我意识到有很多不同的技术,每一种都有自己的优势。
我已经决定,如果我朝相反的方向学习,我可能会走得更远。 IE。选择一个问题/任务并通过解决/完成它来学习。
我偶尔需要对传真的发票进行数据处理,我希望制作一个程序,一旦我扫描然后输入就可以为我输入这些发票。
传真基本上由两张相同的表格组成。每行表示一个单独的工人。第一列是工人姓名(选择 6) 第二列是地址,其余列是表示不同工作的复选框。页面顶部的框中还有一个发票 ID。
我希望有人能简要解释一下他们将如何解决这个问题。他们是否会使用 SVM 进行文本识别或其他技术?以及如何让程序理解第 5 个框中的勾号表示“已清理=是”,左上角框中的数字是 ID。我做了一些研究,但不知道如何开始。如何隔离传真的各个部分,例如当您由于传真/扫描而无法保证绝对位置/大小时,顶部表格及其来自页面其余部分的单元格。还是我得弄几百个传真+这些传真的打出来的数据然后比较然后让它自己慢慢学习传真a和b的区别在这里是打勾,ID号通常在这里......
欢迎任何建议!
【问题讨论】:
标签: python machine-learning image-recognition text-recognition