【发布时间】:2016-11-04 04:32:42
【问题描述】:
我正在尝试查找扫描的 pdf 表单是否包含签名(例如确保支票已签名)。
问题域:
我将收到文件包(带有多个表格的多页 pdf)。我已经将文档包分类器放在一起,这些分类器将检查所有文档的包并将图像缩放到一个通用大小。之后,我知道签名应该在哪里,并且可以专门扫描文档的区域。我正在寻找的是确保存在签名的最佳方法。我考虑过只检查暗像素的基本阈值,但这似乎很笨拙。签名的问题在于它们并不是真正的书写,更多的是个人标记。
我唯一能想到的就是寻找循环的机器学习方法?但我对机器学习并不是很熟悉,甚至不知道从哪里开始这样的事情。任何对实际方法有一些建议的人都将非常感激。
如果有帮助的话,我会用 Java 编写代码
【问题讨论】:
-
这太宽泛了。我们无法在 Stack Overflow 上为您提供有关 OCR 的论文。这是一门非常难而且很难正确开始的主题。
-
要求关于布尔结果的方法建议过于宽泛?是签名不是签名。不知道如何使它更简洁。
标签: java machine-learning ocr handwriting