【问题标题】:Does MuPdf library have unicode or text search functionality?MuPdf 库是否具有 unicode 或文本搜索功能?
【发布时间】:2020-08-02 10:59:11
【问题描述】:

背景

我正在开发一个 WPF windows 应用程序,我想添加只有基本功能的嵌入式 PDF 查看器,包括 PDF 视图、文本搜索和页面导航。

我尝试了嵌入式 Internet Explorer 和 Adob​​e PDF Reader 安装方法(this way),但这种方法不适合我们的要求,因为 Adob​​e PDF Reader 也有可能由于应用程序的安全原因而无法允许的外部链接.

因此,我正在尝试使用moonpdf 库。这个库可以很好地满足我们的要求,但唯一的问题是这个库中没有文本搜索功能。 (我认为它将PDF显示为图像) 然后,我下载了moonpdf源代码并意识到moonpdf正在使用libmupdf.dll包装到c#。 如果需要,我可以根据我们的要求修改moonpdf源代码和mupdf源代码。

我的问题

mupdf 中是否有任何文本搜索功能?如果可以,我该如何使用?

【问题讨论】:

    标签: c# wpf pdf mupdf


    【解决方案1】:

    在基本的 mupdf 库中,有几个用于搜索文本的函数。它们通过在页面中搜索文本字符串以几种不同的变体来工作,并返回给定文本的所有命中的区域。您需要自己遍历页面(以便进行正向或反向搜索)。

    fz_quad hits[1000];
    count = fz_search_page(ctx, page, needle, hits, nelem(hits));
    

    也就是说,我不知道“moonpdf”是如何包装这些功能的。

    【讨论】:

      【解决方案2】:

      您当然可以从文档中提取文本,MuPDF 库可以做到这一点。我相信在此之后应用您自己的搜索条件取决于您。恐怕我不够专业,无法回答其中的“如何做”部分。我想 mutool 示例之一在这里会有所帮助。我会看看我是否可以让其中一位开发人员回答。

      【讨论】:

        猜你喜欢
        • 2020-11-03
        • 2015-10-04
        • 2012-03-09
        • 1970-01-01
        • 2012-10-31
        • 1970-01-01
        • 1970-01-01
        • 2017-04-24
        • 2017-05-03
        相关资源
        最近更新 更多