【问题标题】:Looking for a linux PDF library to extract annotations and images from a PDF [closed]寻找一个 linux PDF 库来从 PDF 中提取注释和图像 [关闭]
【发布时间】:2011-08-20 12:28:47
【问题描述】:

我正在寻找一个免费的库(Java/Ruby),它可以在 linux 上运行,并且可以从 PDF 中提取图像和注释;类似于 CGPDFDocument 在 OS X 上可以执行的操作。

谢谢!

【问题讨论】:

    标签: pdf


    【解决方案1】:

    我不知道图像,但使用 ruby​​ pdfreader 库的最新版本,我能够成功地从一个大 PDF 文件中提取注释:

    PDF::Reader.open(filename) do |reader|
      reader.pages.each do |page|
        annots_ref = page.attributes[:Annots]
        actual_annots = reader.objects[annots_ref]
        if actual_annots && actual_annots.size > 0
          actual_annots.each do |annot_ref|
            actual_annot = reader.objects[annot_ref]
              unless actual_annot[:Contents].nil?
                puts "Page #{page.number},"+actual_annot[:Contents].inspect
              end
            end
        end
      end       
    end
    

    我想可以做类似的事情来提取图像。

    【讨论】:

      猜你喜欢
      • 2011-02-06
      • 2016-01-23
      • 1970-01-01
      • 1970-01-01
      • 2021-01-25
      • 1970-01-01
      • 2010-12-05
      • 2010-09-30
      • 2012-04-11
      相关资源
      最近更新 更多