【发布时间】:2011-08-20 12:28:47
【问题描述】:
我正在寻找一个免费的库(Java/Ruby),它可以在 linux 上运行,并且可以从 PDF 中提取图像和注释;类似于 CGPDFDocument 在 OS X 上可以执行的操作。
谢谢!
【问题讨论】:
标签: pdf
我正在寻找一个免费的库(Java/Ruby),它可以在 linux 上运行,并且可以从 PDF 中提取图像和注释;类似于 CGPDFDocument 在 OS X 上可以执行的操作。
谢谢!
【问题讨论】:
标签: pdf
我不知道图像,但使用 ruby pdfreader 库的最新版本,我能够成功地从一个大 PDF 文件中提取注释:
PDF::Reader.open(filename) do |reader|
reader.pages.each do |page|
annots_ref = page.attributes[:Annots]
actual_annots = reader.objects[annots_ref]
if actual_annots && actual_annots.size > 0
actual_annots.each do |annot_ref|
actual_annot = reader.objects[annot_ref]
unless actual_annot[:Contents].nil?
puts "Page #{page.number},"+actual_annot[:Contents].inspect
end
end
end
end
end
我想可以做类似的事情来提取图像。
【讨论】: