【发布时间】:2015-02-20 08:58:18
【问题描述】:
我想从 PDF 文档中读取 XMP 元数据。我尝试使用 PDFsharp (http://www.pdfsharp.net/) 读取数据。大多数时候它运行良好,但在某些情况下我得到了这个异常:
Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.
我在某处读到这在新版本中不会发生。所以我下载了 PdfSharp 1.50.3638-beta (https://www.nuget.org/packages/PdfSharp/1.50.3638-beta)。
是的,现在我也不例外。但我的新问题是函数 PdfReader.open 不适用于某些文档。这意味着程序永远不会离开函数。
在一些论坛中,我读到它可能是由包含许多图像的大型文档引起的。所以我尝试只读取文档的信息:
PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);
但它仍然不起作用。关于如何读取元数据的一些想法?
【问题讨论】:
标签: c# pdf metadata pdfsharp xmp