【问题标题】:extract pdf formatting提取pdf格式
【发布时间】:2011-08-04 08:43:32
【问题描述】:

大家好,开发一个主要工作是 pdf 编辑的应用程序的人。

我了解 Apple 不提供任何用于编辑 pdf 的 API。但我的要求是这样的。

所以我想提取pdf文件的全部内容并在编辑后创建一个新的pdf。现在我需要知道如何提取 pdf 格式(页眉、页脚、图像、突出显示。、、)

我使用 Tj 运算符来提取 pdf 文本。我应该使用哪些运算符来提取pdf文件的其他信息。

提前致谢。

【问题讨论】:

    标签: iphone objective-c ipad pdf ios4


    【解决方案1】:

    使用 Do 操作符在页面上绘制图像。它的操作数是资源字典中的图像名称。 Do 运算符还绘制 XObjects(自包含矢量图形),这些也存储在资源字典中。图像/表单 XObject 字典中的 Subtype 键为您提供对象类型:“图像”用于图像,“表单”用于表单 XObject。
    其他元素是纯矢量图形和文本,PDF 文件没有页眉、页脚、段落等作为独立对象。在 PDF 文件中,您在视觉上看到的页眉只是在页面顶部绘制的纯文本。
    高亮可以是普通的半透明黄色矩形(它们与页面上的其他矩形没有区别)或高亮注释(这些在页面的 Annots 数组中可用)。

    【讨论】:

    • 您好,感谢您的回复。现在,如果标题只是文本,我如何区分普通文本和标题? Tj 运算符用于文本,所以对于图像我应该使用什么?
    • 对此没有确切的解决方案,您需要定义一些启发式方法,例如所有显示在距页面上边距 20 点或以下的文本都被视为页眉。如何解释页面内容并做出决定取决于您。图像使用“Do”运算符。
    • 哦,谢谢。那么使用uiwebview编辑pdf内容怎么样???如果使用uiwebview,是否可以保存在同一个文件中。我的要求是编辑 pdf 文件。有什么建议吗??
    • UIWebView 不能用于编辑 PDF 文件。恐怕要编辑 PDF 文件,您需要一个第三方 PDF 库。
    猜你喜欢
    • 2012-05-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-25
    • 1970-01-01
    相关资源
    最近更新 更多