【问题标题】:How to get metadata from a pdf file in ruby?如何从 ruby​​ 中的 pdf 文件中获取元数据?
【发布时间】:2018-03-04 03:53:08
【问题描述】:

我想从 ruby​​ 中的 pdf 文件中获取元数据。 不仅仅是它的创建日期,更像是:

  • 版本
  • 页面
  • 安全性
  • 创建于 - [ 最重要的一个 ]​​i>
  • 编码软件:MAC OS X 10.12.6

我查看了 pdfreader,但没有找到从文件中提取它的方法

【问题讨论】:

  • 这是您提到的图书馆的built-in。我们能否看到一个 PDF 文件的具体示例,其中 gem 没有显示必要的元数据?

标签: ruby file pdf metadata reader


【解决方案1】:

大部分信息都可以通过pdf-reader gem 访问:

require 'pdf/reader'

PDF::Reader.open("my-file.pdf") do |reader|
  puts reader.info.inspect
  puts reader.metadata.inspect
  puts reader.page_count
  puts reader.pdf_version
end

【讨论】:

  • 这对我不起作用。 reader.metadata.inspect 返回 nil。我最终使用了对我有用的“Henkei”。
猜你喜欢
  • 1970-01-01
  • 2019-12-01
  • 2014-05-09
  • 1970-01-01
  • 2011-06-10
  • 1970-01-01
  • 2018-03-16
  • 1970-01-01
  • 2019-08-14
相关资源
最近更新 更多