【发布时间】:2017-03-17 01:10:52
【问题描述】:
我需要将 N 个 PDF 文件合并为一个。我先创建一个空白文件
byte[] pdfBytes = null;
var ms = new MemoryStream();
var doc = new iTextSharp.text.Document();
var cWriter = new PdfCopy(doc, ms);
稍后我循环遍历 html 字符串数组
foreach (NBElement htmlString in someElement.Children())
{
byte[] msTempDoc = getPdfDocFrom(htmlString.GetString(), cssString.GetString());
addPagesToPdf(cWriter, msTempDoc);
}
在 getPdfDocFrom 中,我使用 XMLWorkerHelper 创建 pdf 文件并将其作为字节数组返回
private byte[] getPdfDocFrom(string htmlString, string cssString)
{
var tempMs = new MemoryStream();
byte[] tempMsBytes;
var tempDoc = new iTextSharp.text.Document();
var tempWriter = PdfWriter.GetInstance(tempDoc, tempMs);
tempDoc.Open();
using (var msCss = new MemoryStream(System.Text.Encoding.UTF8.GetBytes(cssString)))
{
using (var msHtml = new MemoryStream(System.Text.Encoding.UTF8.GetBytes(htmlString)))
{
//Parse the HTML
iTextSharp.tool.xml.XMLWorkerHelper.GetInstance().ParseXHtml(tempWriter, tempDoc, msHtml, msCss);
tempMsBytes = tempMs.ToArray();
}
}
tempDoc.Close();
return tempMsBytes;
}
稍后我尝试将此 PDF 文件中的页面添加到空白文件中。
private static void addPagesToPdf(PdfCopy mainDocWriter, byte[] sourceDocBytes)
{
using (var msOut = new MemoryStream())
{
PdfReader reader = new PdfReader(new MemoryStream(sourceDocBytes));
int n = reader.NumberOfPages;
PdfImportedPage page;
for (int i = 1; i <= n; i++)
{
page = mainDocWriter.GetImportedPage(reader, i);
mainDocWriter.AddPage(page);
}
}}
当它尝试从我传递给函数的字节数组创建 PdfReader 时,它会中断。 “重建失败:未找到预告片。原始消息:未找到 PDF startxref。”
我以前使用另一个库来处理 PDF。我将 2 个 PdfDocuments 作为对象传递,只是循环添加页面。不过它不支持 Css,所以我不得不切换到 ITextSharp。
我不太明白 PdfWriter 和 PdfCopy 之间的区别。
【问题讨论】: