【问题标题】:PDFBox UTF16 lettersPDFBox UTF16 字母
【发布时间】:2012-09-01 16:38:52
【问题描述】:

有没有人可以帮助我解决 PDFBox 中的字母问题我正在尝试打印字母“ń”(波兰字母)并且我得到了类似 þÿ J 的东西。 Dı B R O W 2S0 :K0 3I.

请帮忙!

【问题讨论】:

    标签: pdfbox letters


    【解决方案1】:

    我在保加利亚语中遇到了同样的问题。简而言之,我认为没有一个简单的解决方案。基本上你需要一个 utf 字体。如果您使用标准的 14 种 type1 字体之一(如 Helvetica 或 Courier)——它们只支持基本的拉丁字母,所以它们无法完成这项工作。您可以加载一个 truetype utf 字体,但 pdfbox 对所有 truetype(以及 type1)字体都有硬编码的 WinAsciiEncoding,这是错误的。据我所知,您可以做 Open office 所做的事情 - 创建字体的子集,这样您就不会将整个字体文件嵌入 pdf 中。不幸的是,pdfbox 中缺少此功能,但有一个 Jira 和更多信息: https://issues.apache.org/jira/browse/PDFBOX-922 如果您找到好的解决方案,请分享!

    【讨论】:

      【解决方案2】:

      您可以将其更改为 unicode 字符到 LegacyPDFStream Engine java 类中

      【讨论】:

      • 那是用于文本提取的。我认为 OP 在创建 PDF 时遇到了问题。 PDFBox 2.0 的发布解决了这个问题。
      猜你喜欢
      • 2011-06-26
      • 1970-01-01
      • 2021-03-02
      • 2014-03-18
      • 2016-11-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多