【问题标题】:Parsing PDF containing special Fonts in php在php中解析包含特殊字体的PDF
【发布时间】:2018-11-07 23:50:33
【问题描述】:

我在 Zendframework 3 项目中使用smalot/pdf-parser 来获取 PDF 文件的内容。到目前为止,使用的文件是带有基本字体的 PDF 1.3 文件。但是创建文件的源将很快更新,文件将是带有一些特定字体的 PDF 1.5。

尝试解析新文件时出现此错误:

Object list not found. Possible secured file.

我尝试转换为较低的 PDF 版本并且可以解析文件。但是我从使用的特殊字体中得到了特殊字符的错误,因为我们得到了很多这些 PDF,转换每个文件然后将其上传到我们的系统不是一个可行的选择。

我还尝试将使用的字体安装到 tcpdf 库中。错误仍然存​​在。

使用基本字体创建 PDF 1.5 时,我可以读取该文件,因此我相当确定可以通过正确使用正确的字体或转换 pdf 中的字体来解决该错误。

我发现这个issue 有两种可能的解决方案。首先有人提到将字体安装到 tcpdf 包中,完成但没有工作 - 虽然我不是 100% 确定我得到了所有字体.. 有没有办法用 tcpdf 调试它?

第二个人提到了

我更改了我感兴趣的转义序列的代码。

这为他解决了这个问题。但我不知道该怎么做。

【问题讨论】:

    标签: php fonts tcpdf


    【解决方案1】:

    我最终使用 ghostscript 来转换 PDF

    $cmd = 'gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dBATCH -dNOPAUSE -sOutputFile=' . $outputFile . ' ' . $inputFile;        
    exec($cmd);
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-05-22
      • 1970-01-01
      • 2013-06-20
      • 1970-01-01
      • 2019-09-29
      • 1970-01-01
      • 1970-01-01
      • 2015-06-16
      相关资源
      最近更新 更多