【问题标题】:unable to perform OCR on tiff and jpeg files无法对 tiff 和 jpeg 文件执行 OCR
【发布时间】:2017-06-26 16:32:45
【问题描述】:

我指的是“https://github.com/keensoft/alfresco-simple-ocr”对 tiff 和 jpeg 文件执行 OCR,但它说“找不到预告片字典”、“无法读取外部参照表”、“异常失败”(“错误:pdfinfo 可以不确定页数。检查 pdf 输入文件。\n")" 虽然从 jpeg 或 tiff 文件到 PDF 文件的转换工作正常,并且 PDF 文件在 alfresco 共享页面上可见" 但没有 OCR 对这些文件起作用tiff 和 jpeg 文件

【问题讨论】:

标签: alfresco


【解决方案1】:

基本上有很多工具可用于对 pdf 文件执行 OCR。这也取决于工具。在 alfresco 中有一个错误。这是一个库问题。以下是详细信息。


创建名为 transformation.sh 的文件,在其中添加命令之前,您必须在其中添加以下行。如果您使用的是 Windows,则需要相应地创建批处理文件。

取消设置 LD_LIBRARY_PATH

如果您没有在脚本文件中进行上述设置,您将在对话时遇到错误。您可以在下面的 alfresco 链接中找到该错误详细信息。它在 alfresco 中注册的问题。

https://issues.alfresco.com/jira/browse/ALF-19946

PDF 到 PDF 的对话在下面的链接中有很好的解释。

http://www.krutikjayswal.com/2016/07/ocr-on-pdf-file-in-alfresco.html

您可能需要更改 tiff 对话的源代码。

【讨论】:

    猜你喜欢
    • 2012-02-03
    • 1970-01-01
    • 1970-01-01
    • 2011-08-09
    • 1970-01-01
    • 2021-07-03
    • 2022-07-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多