【发布时间】:2023-03-27 07:23:02
【问题描述】:
我搜索了很多。我别无选择,除非在这里问这个。你们知道有 API 或 Gem/s 可以将 PDF 转换为 Excel 或 CSV 文件的在线转换器吗?
我也不确定这里是否是问这个问题的最佳地点。
我的应用程序在 Rails 4.2 中。 PDF 文件包含一个标题和一个大约 10 列的大表格。
更多信息: 用户通过表单上传 PDF,然后我需要将 PDF 解析为 CSV 并阅读内容。我尝试使用 PDF Reader Gem 阅读内容,但结果并不理想。
我使用过:freepdfconvert.com/pdf-excel 不幸的是,不提供 API。 (我已经联系他们了)
示例 PDF
这段代码将 PDF 转换成文本,很方便。
宝石:pdf-reader
def self.parse
reader = PDF::Reader.new("pdf_uploaded_by_user.pdf")
reader.pages.each do |page|
puts page.text
end
end
现在,如果您检查随附的 PDF 示例,您会看到一些字段可能为空,这意味着我根本无法用空格分割文本行并将其放入数组中,因为我无法映射数组到正确的字段。
谢谢。
【问题讨论】:
-
真的吗??为什么给它一个减分。我问了一个问题。你可以简单地说这不属于这里而不是给它一个减分>:(
-
您是从您的程序生成 pdf 还是外部 pdf??
-
刚刚更新了我的问题。谢谢
标签: ruby-on-rails ruby api csv pdf