【发布时间】:2016-03-05 20:11:49
【问题描述】:
我正在从数千个 PDF 文件中抓取数据。目前我使用 Adobe 控件打开 PDF 文件,然后手动执行 CTRL+A, CTRL+C将文本复制到剪贴板。然后我单击另一个处理文本并提取 PDF 文件中所需字段的按钮。
如果我可以跳过手册 CTRL+A、CTRL+C,那就太好了。然后我可以进一步自动化这个过程。
提示?
【问题讨论】:
-
你有没有想过使用PDF API直接读取PDF文件并提取文本,而不需要Adobe Reader?您的问题看起来像 stackoverflow.com/questions/2116440/… 的副本 - 这是针对 C# 的,但任何 C# 库也适用于 VB.NET,因为它们都在 .NET 框架中工作。 PDF 库的好处:减少每次启动和关闭 Adobe Reader 的开销。