【问题标题】:Copying text out of SyncFusion generated PDF/A fails从 SyncFusion 生成的 PDF/A 中复制文本失败
【发布时间】:2021-06-15 15:24:32
【问题描述】:

在我们的 C# 项目中,我们使用 WKHTMLTOPDF 从 HTML 创建 PDF 文档。 现在我们想使用我们购买的 SyncFusion-Libraries 来生成 PDF/A 兼容的 PDF 文件。 这似乎有效。如果我们在 Acrobat 中打开 PDF 文件,它们会显示为 PDF/A 兼容。

但是如果我们想从生成的 PDF/A-Files 中复制文本,它会这样粘贴:

????????????????????????????????????????????????????????????????
????????????????????????????????????????????????????????????????????????????

从原始 PDF 复制和粘贴有效:

My First Heading
My first paragraph.

我将代码分解为一个最小示例:

using Syncfusion.Pdf;
using Syncfusion.Pdf.Parsing;

namespace SyncFusionCreatePdfA_Test
{
  class Program
  {
    static void Main(string[] args)
    {
      // -------------------------------
      // The "Sample.html" looks like:
      // -------------------------------
      // <!DOCTYPE html>
      // <html>
      // <body>
      // <h1>My First Heading</h1>
      // <p>My first paragraph.</p>
      // </body>
      // </html>

      //The "sample.pdf" generated by WkHtmlToPdf out of the "Sample.html"
      var loadedDoc = new PdfLoadedDocument(@"C:\Users\reichert\Downloads\sample.pdf");
      
      loadedDoc.ConvertToPDFA(PdfConformanceLevel.Pdf_A1B);
      loadedDoc.Save(@"C:\Users\reichert\Downloads\sample_pdfa.pdf");
      loadedDoc.Close(true);
    }
  }
}

问题:如何使用 SyncFusion 创建 PDF/A,并从中正确复制文本?

示例文件: sample.html sample.pdf samplepdfa.pdf

【问题讨论】:

  • 在转换过程中,Syncfusion 组件会删除文本复制和提取所需的 ToUnicode 表。与他们交谈,了解他们这样做的原因。

标签: c# pdf wkhtmltopdf syncfusion pdfa


【解决方案1】:

我们已经在最近的版本中修复了类似类型的报告问题。因此,如果可能,请将您的产品版本升级到 (19.1.0.69) 以解决此问题。请找到最新的 NuGet 链接,

NuGet 链接:https://www.nuget.org/packages/Syncfusion.Pdf.Wpf/19.1.0.69

我们附上了从最新版本生成的输出文档,

输出:https://www.syncfusion.com/downloads/support/directtrac/general/pd/Sample_A1b_Latest-738805176

注意:我为 Syncfusion 工作。

【讨论】:

    猜你喜欢
    • 2018-08-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-18
    • 1970-01-01
    • 2013-06-05
    • 1970-01-01
    相关资源
    最近更新 更多