【问题标题】:Can I emulate a CTRL-a,CTRL-c in Adobe PDF reader from vb studio?我可以在 vb studio 的 Adob​​e PDF 阅读器中模拟 CTRL-a、CTRL-c 吗?
【发布时间】:2016-03-05 20:11:49
【问题描述】:

我正在从数千个 PDF 文件中抓取数据。目前我使用 Adob​​e 控件打开 PDF 文件,然后手动执行 CTRL+A, CTRL+C将文本复制到剪贴板。然后我单击另一个处理文本并提取 PDF 文件中所需字段的按钮。

如果我可以跳过手册 CTRL+ACTRL+C,那就太好了。然后我可以进一步自动化这个过程。

提示?

【问题讨论】:

  • 你有没有想过使用PDF API直接读取PDF文件并提取文本,而不需要Adobe Reader?您的问题看起来像 stackoverflow.com/questions/2116440/… 的副本 - 这是针对 C# 的,但任何 C# 库也适用于 VB.NET,因为它们都在 .NET 框架中工作。 PDF 库的好处:减少每次启动和关闭 Adob​​e Reader 的开销。

标签: vb.net pdf


【解决方案1】:

Amadee - 感谢您再次尝试 iTextSharp。我一直遇到错误并且非常沮丧,但现在它可以完美运行。

对于其他尝试这样做的人,这是我的测试项目代码:

    Option Explicit On
    Option Strict On

    Imports System.IO 'Working With Files
    Imports System.Text 'Working With Text
    Imports System.Collections.Generic 'For the StringBuilder

    'iTextSharp Libraries
    Imports iTextSharp.text 'Core PDF Text Functionalities
    Imports iTextSharp.text.pdf 'PDF Content
    Imports iTextSharp.text.pdf.parser 'Content Parser


    Public Class Form1

        Private Sub Form1_Load(sender As System.Object, e As System.EventArgs) Handles MyBase.Load

            Dim strFileName As String
            Dim strText As String
            Dim intPageCount As Integer
            Dim intI As Integer

            Dim strOut As StringBuilder = New StringBuilder()

            strFileName = "E:\2020-Skysight-14288.pdf"
            Label_Filename.Text = strFileName

            Dim Reader As New PdfReader(strFileName) 'Read Our File

            intPageCount = Reader.NumberOfPages

            Label_PageCount.Text = intPageCount.ToString & "Pages"

            For intI = 1 To intPageCount
                strText = PdfTextExtractor.GetTextFromPage(Reader, intI)
                strOut.Append(strText)
            Next

            RichTextBox1.AppendText(strOut.ToString)

            strText = strOut.ToString

        End Sub

    End Class

【讨论】:

  • 我的名字不是 Amadee。
猜你喜欢
  • 2013-01-01
  • 2018-06-18
  • 2023-03-31
  • 1970-01-01
  • 2011-01-18
  • 1970-01-01
  • 2021-06-02
  • 2012-08-16
  • 2010-12-23
相关资源
最近更新 更多