【发布时间】:2012-12-29 06:20:35
【问题描述】:
谁能帮助我了解如何使用 itext 或 pdfbox 提取表格数据,我有一个 1000 页的 pdf,我的工作是解析 pdf 并将数据存储到数据库中。
【问题讨论】:
-
如果您想尝试使用 iText(Sharp) 进行此操作,您可能会对 iText 邮件列表中的此线程感兴趣:parse tabular data in PDF using iTextSharp。不过,正如@mark 在他的回答中所说,通用解决方案屡试不爽。如果您的 1000 页有非常统一的表格,那么特别定制的提取例程可能是最好的方法。
标签: java parsing pdf web-applications itext