【发布时间】:2011-07-12 06:10:56
【问题描述】:
我们正在使用 Tesseract 的 Java 库,称为 Tess4j 将 PDF 文件转换为文本。 它适用于 Tiff 文件以及一页 PDF 文件。但是对于多页 PDF,它确实会生成输出文件,当涉及到最后一页时,控件似乎并没有回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。 是不是本地调用没有返回的问题。我不知道,
如果有解决此问题的方法,请尽快告诉我。
问候
维什
【问题讨论】:
标签: pdf ocr tesseract multipage