【问题标题】:Problem with converting ps to pdf if source was pdf type如果源是 pdf 类型,则将 ps 转换为 pdf 的问题
【发布时间】:2019-02-22 08:46:08
【问题描述】:

我有我打印的源 pdf 文件,我通过 MultiFilePortMonitor 获取 .prn 文件。
然后我尝试使用以下说明将此 .prn 文件转换回 pdf:

gswin64.exe -dPDFA=1 -dBATCH -dNOPAUSE -sColorConversionStrategy=/RGB -sDEVICE=pdfwrite -sOutputFile="C:\targeFile.pdf" "C:\sourceFile.prn"

但是当我这样做时,所有字体都丢失了,我看到了正常的 pdf,但它不再包含可搜索的文本,但似乎是一张图片。

当 sourceFile 不是 PDF 而是例如 word 文件时,一切正常,我得到一个格式良好的可搜索 pdf 文件,并且字体被嵌入。
我已经尝试了几个 gs-version 9.20、9.22 和 9.26。结果相同。

我做错了什么?

【问题讨论】:

    标签: pdf pdf-generation ghostscript postscript


    【解决方案1】:

    当您打印 PDF 文件时,很可能会出现缺少可搜索文本的情况。假设您使用 PostScript 打印机打印。

    PDF 不再与 PostScript 共享相同的图形模型;特别是它可以包含不能在 PostScript 中建模的透明度。在 PostScript 成像模型中表示透明 PDF 的唯一方法是将透明区域(至少)渲染为位图图像并将其包含在内。

    在我看来,这就是你正在发生的事情。

    故事的寓意;如果您有 PDF 并且想要 PDF,请不要将其转换为其他内容并返回。你为什么要这么做?

    【讨论】:

    • 我这样做是因为我编写了一个软件来处理通过 MFileMon 打印机打印的文档。我的问题是任何人都可以使用这台打印机,但我不知道源文件是什么。我只得到 Postscript 文件,当这个 ps 文件是 PDF 之前,我无法再处理它了
    • 好吧,坦率地说,这是你的问题。我已经解释了它发生的原因,而且很可能与 Ghostscript 无关;损坏是由打印 PDF 文件的操作造成的。将 PDF 转换为位图后,恢复搜索功能的唯一方法是将其放入 OCR 软件,然后在 PDF 文件中的位图顶部覆盖不可见的文本。并非不可能,但 Ghostscript 不会这样做,它不是 OCR 软件。当然,您还没有提供示例文件,所以我可能是错的。也许您需要重新考虑您的方法。
    猜你喜欢
    • 1970-01-01
    • 2016-07-13
    • 2014-03-28
    • 1970-01-01
    • 2023-04-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-21
    相关资源
    最近更新 更多