【问题标题】:Search text in pdf在 pdf 中搜索文本
【发布时间】:2012-02-10 12:23:12
【问题描述】:

谁能告诉我com引用中的AcrobatAccessLib(Acrobat Access 3.0类型库)是否可以用于pdf文档中的文本搜索? 它包含类 PDDom,但我不知道是否可以将文档加载到其中,或者如何使用它。

(我不想使用 iTextSharp 和其他人,我尝试过,但没有按我的意愿工作 - pdf 已损坏数字分页 + 包含跨 2 页的表格 - iTextSharp 发现我在两页上搜索文本 - 而不是 1 ,但如果我使用 Acrobat Reader - 效果很好)

编辑:或者另一个问题,我可以在我的应用程序中使用 acrobat reader 及其搜索模块吗?

我在 c# 中工作

非常感谢!

【问题讨论】:

    标签: c# pdf acrobat-sdk


    【解决方案1】:

    尝试使用 PDFLIBNET.DLL

    在那个 dll 中有 pdfwrapper 类,这个类提供了很多方法来从 pdf 中获取文本。 FindText 方法用于从特定位置获取文本,exportToText 方法给出pdf页面的内容

    您将从该内容中搜索 pdf 内容..

    我正在使用 tat DLL 并毫无问题地搜索 pdf 内容..

    试试看告诉我..

    【讨论】:

    • 有文本搜索的功能,但是如何获取找到文本的页数? f.e - int c = a.FindFirst("A9F03102", PDFLibNet.PDFSearchOrder.PDFSearchFromdBegin, false, true); c=1 但此文本在 68 页上
    • k.. 使用 exportTotext 方法给出完整的 pdf 文本,在这里你搜索从起始页到结束页的文本,在 for 循环之间你会找到页面上的文本..
    【解决方案2】:

    如果钱不是问题,我会使用 Aspose PDF 组件。它们运行良好,专为服务器使用而构建。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-03-01
      • 2013-06-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-29
      相关资源
      最近更新 更多