【发布时间】:2011-07-06 08:06:43
【问题描述】:
我正在创建一个服务来监控文件夹中的扫描文件。一旦文件存在,该服务就会将其拾取,并将其转换为可读的 PDF。在此过程中,该服务还会搜索条形码。在此之后,提取文本并将文件及其文本存储到我们软件的数据库中。位置基于条形码。
现在,对于 OCR,我们使用 Atalasoft 的 SDK (http://www.atalasoft.com/)。 此 SDK 中还包含条码识别器。
但是转换后的文本还是有一些错误。 (我用其他 OCR 程序进行了一些测试,但 Atalasoft 表现不错。) 我正在寻找一些软件(SDK-kit),它可以让我提高用于 OCR 目的的 PDF 质量。
我测试了 Kofax VRS Elite (http://www.kofax.com/vrs-virtualrescan/)。我正在寻找类似的东西,但可以使用某种 SDK 套件在服务中实现。
以前有没有人这样做过,或者遇到过类似的问题? 提前谢谢!
【问题讨论】: