使用 PdfSharp 来自 Pdf 的 XMP 元数据答案

【问题标题】：XMP Metadata from Pdf using PdfSharp使用 PdfSharp 来自 Pdf 的 XMP 元数据
【发布时间】：2015-02-20 08:58:18
【问题描述】：

我想从 PDF 文档中读取 XMP 元数据。我尝试使用 PDFsharp (http://www.pdfsharp.net/) 读取数据。大多数时候它运行良好，但在某些情况下我得到了这个异常：

Unhandled Exception: PdfSharp.Pdf.IO.PdfReaderException: Cannot handle iref streams. The current implementation of PDFsharp cannot handle this PDF feature introduced with Acrobat 6.

我在某处读到这在新版本中不会发生。所以我下载了 PdfSharp 1.50.3638-beta (https://www.nuget.org/packages/PdfSharp/1.50.3638-beta)。

是的，现在我也不例外。但我的新问题是函数 PdfReader.open 不适用于某些文档。这意味着程序永远不会离开函数。

在一些论坛中，我读到它可能是由包含许多图像的大型文档引起的。所以我尝试只读取文档的信息：

PdfDocument pd = PdfReader.Open(s, PdfDocumentOpenMode.InformationOnly);

但它仍然不起作用。关于如何读取元数据的一些想法？

【问题讨论】：

标签： c# pdf metadata pdfsharp xmp

【解决方案1】：

对 IRef 流的支持是 PDFsharp 1.50 beta 的新增功能，如果您有无法读取的文件，请提交以供检查。

【讨论】：

下载 1.50 到这里：nuget.org/packages/PdfSharp/1.50.3638-beta。您需要创建一个登录名才能直接下载包含 PDFsharp 的 zip 存档。