【问题标题】:tesseract ocr multipage pdf hangstesseract ocr 多页 pdf 挂起
【发布时间】:2011-07-12 06:10:56
【问题描述】:

我们正在使用 Tesseract 的 Java 库,称为 Tess4j 将 PDF 文件转换为文本。 它适用于 Tiff 文件以及一页 PDF 文件。但是对于多页 PDF,它确实会生成输出文件,当涉及到最后一页时,控件似乎并没有回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。 是不是本地调用没有返回的问题。我不知道,

如果有解决此问题的方法,请尽快告诉我。

问候
维什

【问题讨论】:

    标签: pdf ocr tesseract multipage


    【解决方案1】:

    Tess4J 确实支持多页 PDF 和多页 TIFF。在单元测试用例中用您的 PDF 文件替换并试一试。

    【讨论】:

      猜你喜欢
      • 2015-06-21
      • 1970-01-01
      • 1970-01-01
      • 2015-09-04
      • 2018-08-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-10-30
      相关资源
      最近更新 更多