【问题标题】:Possible to replace unusual PDF document's fonts with normal fonts? [closed]可以用普通字体替换不常见的 PDF 文档字体吗? [关闭]
【发布时间】:2016-08-21 10:34:12
【问题描述】:

我收到了一个使用不寻常字体的 PDF 文件。

字体在人眼看来很好,

但如果我尝试cut-past 他们,我会得到一串'???'

是否可以用普通字体替换 PDF 文档中定义的字体(例如,在 Foxit Phantom PDF 编辑器上)?

【问题讨论】:

  • 否 - 出于各种原因。首先, font 不是问题,但它的(缺乏)编码是。如果你用另一种字体替换字体,你仍然会得到那些问号,因为你没有替换它的 text。其次,文本可能使用了其他字体不可用的字符。
  • 感谢@Rad。不过,我无法理解您的第二点:正如您从屏幕截图中看到的那样,文本只是简单的英文,即常规拉丁字符。
  • 可以使用 Acrobat Pro 重新创建编码(也许),并在您的计算机上安装原始字体和新字体。在 Acrobat 中,您将使用适当的预检配置文件。
  • 一种字体可能包含看起来像普通纯英文文本但仍然很特别的字符。例如,自定义连字。
  • 是什么让您认为从 PDF 复制粘贴文本会起作用? PDF 不包含与文本文档甚至 word 文档相同的“文本”,因此,如果 PDF 不是在打开“保留复制粘贴能力”选项或“禁止复制-粘贴”选项打开,那么你就不能可靠地,甚至根本不能复制粘贴。话虽如此,您还记得粘贴到 unicode 文档中,而不是“notepad.exe 文本文件”之类的吗?

标签: pdf fonts truetype typeface foxit


【解决方案1】:

这可能是可能的,例如使用来自Enfocus 的 PitStop Pro。但是,正如 cmets 中的其他人所指出的那样,pdf 中的字体和 pdf 本身可能已经拥有所有信息,可以将其删除。

更多细节可能:

PDF 中的编码可以告诉软件要显示哪个字符,然后从字体中选择该字符进行显示,但也可以创建一个 pdf,因此它只显示“显示字形编号 3”嵌入字体”。这就是您在摘要中看到的“Identity-H”编码的作用。

请注意,在谈论组成字体的各个“绘图”时,专门使用字形而不是“字符”一词来表示这些东西只是“随机”绘图,直到在字体中添加一些信息来表示它们代表哪个字母(或其他字符,如数字)。

例如对于字符“lower-case-a”,您当前查看的字体具有以下字形:

一个

但其他字体可能看起来完全不同。只是因为我们已经学会将这些不同的图像读取为小写字母 a,我们才会认为它们是/表示“相同的字母”。

如果 PDF 中不存在此信息(如您的情况),则仍然有可能从 pdf 中包含的字体中获取此信息:您计算机上的字体需要某种方式来允许程序选择如果要显示“小写-a”,则使用正确的字形。但是,如果 pdf 设置为简单地说“显示嵌入字体的第 3 个字形”,则不再需要此信息,并且可以在将字体放入 pdf 之前从字体中删除。这样做是为了使 pdf 更小,或防止人们复制文本,例如受版权保护的作品。

在这种情况下,只有 OCR 可以提供帮助。我认为 Adob​​e Acrobat(完整版,而不是 Adob​​e Reader)在最新版本之一中完全添加了该内容;然而这意味着它试图从显示的“图像”中猜测字母,所以这可能会出错。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-10-22
    • 2013-01-31
    • 2013-05-17
    • 2019-11-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-12-01
    相关资源
    最近更新 更多