【问题标题】:How to Read a PDF File如何阅读 PDF 文件
【发布时间】:2012-05-16 08:29:42
【问题描述】:

除了使用 ADO 之外,还有其他方法可以使用 VB6 从 PDF 文件中提取数据吗?我已经成功地在不使用 Acrobat Reader 的情况下使用 VB6 打开了 PDF 文件,但我项目的下一步需要读取 PDF 文件并从中查找数据。示例哪些页面显示“水泥”一词?

【问题讨论】:

标签: pdf vb6


【解决方案1】:

通常,您需要依赖外部库。一个纯 VB 解决方案(即,将文件作为文本读取并自己处理)不是您在一周内完成的。

您可以通过自动化使用 Adob​​e Acrobat。一个让你开始的例子是例如http://www.freevbcode.com/ShowCode.asp?ID=7066。但是请注意,Adobe Reader 是不够的,您确实需要完整的 Acrobat。还有其他流行的 PDF 阅读库(例如 poppler),但是您可能很难使用 VB6 中的那些。

一般来说,您成功的机会取决于您所说的“提取”是什么意思。简单的说, PDF 是一种没有元信息的纯描述性格式。 IE。该文件包含诸如“Put an A at (x1,y1); put 'foo' at (x2, y2)”等指令。读取表格或任何类型的结构化信息都需要大量的启发式算法。

最好的做法可能是尝试以更适合的数据格式(纯文本、XML 等)获取您想要提取的数据。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-12-16
    • 1970-01-01
    相关资源
    最近更新 更多