【发布时间】:2020-03-27 08:03:00
【问题描述】:
我有一个包含大量 xmp 元数据的 PDF 文件。我用itext7处理的时候,程序卡在var pdfdocument origpdf = new pdfdocument (pdfreader);语句中查看source code,发现是在Pdfdocument对象的构造函数中执行了open(null)方法,最后卡在reader.pdfaconformancelevel = pdfaconformancelevel.getconformancelevel (xmpmatafactory. Parsefrombuffer (xmpmetadata));并且没有办法避免它,xmp 元数据对我来说毫无用处。
使用 itextSharp,基于Remove XMP Metadata on PDF/A,我可以得到一个没有元数据的 pdf 文件。
PdfReader reader = new PdfReader(src);
PdfDictionary dict = reader.Catalog;
dict.Remove(PdfName.METADATA);
dict.Remove(PdfName.PROPERTIES);
reader.RemoveUnusedObjects();
PdfStamper stamper = new PdfStamper(reader, new FileStream(target, FileMode.Create, FileAccess.ReadWrite));
stamper.Close();
我尝试创建 PdfReader 或 PdfDocument 的子类,以尝试干扰加载元数据,但都失败了。
使用itext7,有什么办法可以避免加载元数据?或者有什么方法可以删除 XMP 元数据?
【问题讨论】:
-
您好,能否附上PDF文件重现问题?
-
testfile.谢谢。