【问题标题】:How can I call the Acrobat feature OCR from C#? [closed]如何从 C# 调用 Acrobat 功能 OCR? [关闭]
【发布时间】:2009-07-03 11:18:06
【问题描述】:

我想编写一个可以利用 Adob​​e Acrobat 中的 OCR 功能的 C# 应用程序。我怎么能这样称呼?有公共 API 吗?

【问题讨论】:

    标签: c# api adobe ocr acrobat


    【解决方案1】:

    我相信这是 Adob​​e Reader 软件的一部分,无法通过 API 访问。有一个 API 和库用于根据格式规范构建 PDF 文档,但 OCR 是与读者有关的东西,而不是格式。恐怕您要么必须使用另一个库,要么自己实现它。

    【讨论】:

    • 确定吗?因为我只需要它的形式:makeOCR(file);然后他打开文件并制作 OCR
    • @Salvo 任何想法我们可以使用 acrobat 将 html 转换为 pdf。你能给我任何有用的链接吗。我打算在 .Net 应用程序中使用它
    【解决方案2】:

    没有适用于 .net 的直接 Adob​​e OCR API。但是,对于您要实现的目标,有一些替代方案。 Google 的开源 Tesseract OCR 有一个开源的 .Net 包装器,可以在 GitHub 上找到:https://github.com/charlesw/tesseract。这应该让您在 C# 中具有 OCR 功能。

    来自文档:

    快速入门

    1. 通过从Package Manager Console 运行Install-Package Tesseract 添加Tesseract NuGet 包。
    2. 确保您已安装 Visual Studio 2012 x86 和 x64 运行时
    3. tesseract-ocr 下载 tesseract 3.02 的语言数据文件并将它们添加到您的项目中,确保“复制到 输出目录”设置为始终。
    4. 查看示例解决方案 ~/Samples/Tesseract.Samples.sln 以获取工作示例

    【讨论】:

      猜你喜欢
      • 2010-11-15
      • 1970-01-01
      • 2015-02-01
      • 2013-07-14
      • 1970-01-01
      • 2022-01-23
      • 2023-01-11
      • 1970-01-01
      • 2015-11-25
      相关资源
      最近更新 更多