【发布时间】:2012-11-16 01:53:28
【问题描述】:
您好,我正在尝试用 Ruby 阅读 pdf,首先我想将其转换为 txt。 path 是 PDF 的路径,关键是我得到了一个空的 .txt 文件,正如有人告诉我的那样,这是一个 pdftotext 问题,但我不知道如何解决。
spec = path.sub(/\.pdf$/, '')
`pdftotext #{spec}.pdf`
file = File.new("#{spec}.txt", "w+")
text = []
file.readlines.each do |l|
if l.length > 0
text << l
Rails.logger.info l
end
end
file.close
我的代码有什么问题?谢谢!
【问题讨论】:
-
你应该先检查它是否被创建。这是肯定的。
-
是的,它被创建了,但是是空的,我不知道为什么......
-
那么
pdftotext有问题。如果您在命令行中执行此操作并且仍然得到一个空白文件,那么 ruby 就没有什么了。 -
是的,我刚刚下载了这个:foolabs.com/xpdf/download.html