【发布时间】:2012-01-30 13:26:49
【问题描述】:
我们的系统工作方式如下:
- PDF 文件使用mPDF library 在服务器上生成。
- 用户在浏览器中查看生成的 PDF 文件,有时将其打印到创建 EMF 文件的虚拟打印机。
- 分析 EMF 文件以提取文本信息。
- 进一步处理提取的文本信息。
我在这个过程中的一部分是从 EMF 文件中提取文本信息。当 EMF 文件确实包含文本信息时,我的算法工作正常。但是当 PDF 文件打印到虚拟打印机时,打印软件会将部分文本信息替换为线条和曲线,从而无法从 EMF 中提取文本信息。
我对这个问题进行了大量研究,并得出结论,对于每个打印的 PDF 都没有共同的解决方案。但同时我发现打印软件只替换那些使用嵌入式 OpenType 字体的文本部分。
所以在这种特殊情况下,如果我可以将 mPDF 配置为不使用嵌入式 OpenType 字体,那么问题将得到解决。
我的问题是,是否可以通过不使用嵌入式 OpenType 字体的方式配置 mPDF?
【问题讨论】:
-
您能具体说明您指的是哪种EMF文件吗?
-
@hakre 我们使用标准 EMF 文件。它们不是后台处理程序文件。只是由我们的虚拟打印机创建的标准 EMF。 Enhanced Metafile