【发布时间】:2013-01-24 20:09:21
【问题描述】:
使用 Kofax Capture 10(SP1、FP2),我在文档的某些字段上设置了识别区域。这些字段始终将 I 识别为 1。我已经尝试了所有我能想到的设置组合,它们不会抹去该字段中的所有字符,但无济于事。我尝试过 Advanced OCR 和 High Performance OCR,不同的字符过滤器。各种东西。
我可以尝试哪些选项来自动识别此字符?我应该告诉制作表格的人(它们是由计算机生成的)他们需要尝试使用不同的字体吗?说服他们现在是考虑使用验证的时候了?
我当前的字段设置:
Kofax Advanced OCR 没有自定义设置,除了高级对话框中的最大化准确度。这和我迄今为止尝试过的任何其他方法一样有效。
使用的字体是 8 - 12 pt arial,顺便说一句。
【问题讨论】:
-
其他字母好像没有这个问题
-
扫描分辨率是多少?
-
我相信它是 200 dpi。导入的 PDF 文件只有 120 dpi,所以我没有浪费精力试图从中获得更多。
-
对于成功的 OCR,分辨率非常低,我对您遇到问题并不感到惊讶!我想您在导入过程中使用 VRS 来尝试尽可能多地清理图像?
-
只是常规的识别配置文件。他们似乎做得很合理。我想我只是不确定 VRS 还能做什么。也就是说,我们在一组特定的测试文件上的准确率高达 90% - 96%,而这只是一个真正无法支撑它的领域。 Kofax 支持甚至不认为我可以做更多的事情来增加它。我想我可以要求他们将 DPI 调高一点,也许到 300。