【问题标题】:PDFBox, BBox, page number?PDFBox,BBox,页码?
【发布时间】:2012-09-01 16:10:59
【问题描述】:

我正在使用 PDFBox,成功地从 PDF 中检索字段坐标。继续处理多页 PDF,我遇到了需要确定这些字段来自哪个页面的情况,此外还需要将坐标从自下而上转换为自上而下。我已经阅读了该文档的许多页面,以找到一种可行的方法,大多数返回 null 或失败,并且搜索时没有结果。

我在寻找什么?文件大纲? BB们?媒体框?裁剪框?

对于页码,其他一些库具有诸如 getCurrentPageNo() 之类的简单标题方法。我需要:

List allPages = document.getDocumentCatalog().getAllPages();
  for (int i = 0; i < allPages.size(); i++) {
  // etc for each one?
}

这是一个核心能力,我有点惊讶我还没有找到一个例子。

【问题讨论】:

    标签: java dimensions pdfbox


    【解决方案1】:

    知道了:

    PDPage page = .........
    PDRectangle mediaBox = page.getMediaBox();
    System.out.println( "Width:" + mediaBox.getWidth() );
    System.out.println( "Height:" + mediaBox.getHeight() )
    

    对于页码:

    page.getCOSDictionary().equals(page))
    

    【讨论】:

    • 最后一个片段“为页码”是错误的还是不清楚?谢谢!
    • 是的,结果是错误的,从不增加超过第 1 页。仍然没有线索。
    • 您需要“真正的”页码 - 打印在页面上的页码,可能不是数字 - 还是只需要序号页码 (1-n)?
    • 我最终只使用了我正在使用的交互程序的索引,效果很好。谢谢!
    • 不确定你的意思。您是否能够查明某个字段是否存在于特定页面上?
    猜你喜欢
    • 2013-05-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-01-21
    相关资源
    最近更新 更多