【发布时间】:2021-06-15 15:24:32
【问题描述】:
在我们的 C# 项目中,我们使用 WKHTMLTOPDF 从 HTML 创建 PDF 文档。 现在我们想使用我们购买的 SyncFusion-Libraries 来生成 PDF/A 兼容的 PDF 文件。 这似乎有效。如果我们在 Acrobat 中打开 PDF 文件,它们会显示为 PDF/A 兼容。
但是如果我们想从生成的 PDF/A-Files 中复制文本,它会这样粘贴:
????????????????????????????????????????????????????????????????
????????????????????????????????????????????????????????????????????????????
从原始 PDF 复制和粘贴有效:
My First Heading
My first paragraph.
我将代码分解为一个最小示例:
using Syncfusion.Pdf;
using Syncfusion.Pdf.Parsing;
namespace SyncFusionCreatePdfA_Test
{
class Program
{
static void Main(string[] args)
{
// -------------------------------
// The "Sample.html" looks like:
// -------------------------------
// <!DOCTYPE html>
// <html>
// <body>
// <h1>My First Heading</h1>
// <p>My first paragraph.</p>
// </body>
// </html>
//The "sample.pdf" generated by WkHtmlToPdf out of the "Sample.html"
var loadedDoc = new PdfLoadedDocument(@"C:\Users\reichert\Downloads\sample.pdf");
loadedDoc.ConvertToPDFA(PdfConformanceLevel.Pdf_A1B);
loadedDoc.Save(@"C:\Users\reichert\Downloads\sample_pdfa.pdf");
loadedDoc.Close(true);
}
}
}
问题:如何使用 SyncFusion 创建 PDF/A,并从中正确复制文本?
【问题讨论】:
-
在转换过程中,Syncfusion 组件会删除文本复制和提取所需的 ToUnicode 表。与他们交谈,了解他们这样做的原因。
标签: c# pdf wkhtmltopdf syncfusion pdfa