【问题标题】:Send S3 document to Textract using Go使用 Go 将 S3 文档发送到 Textract
【发布时间】:2020-11-26 20:55:57
【问题描述】:

我正在尝试使用 Go 将 S3 存储桶中的对象发送到 Textract 并收集响应。

我正在使用 aws go sdk 包,能够连接到我的 S3 存储桶并列出其中包含的所有对象。到目前为止,一切都很好。我现在需要能够将其中一个对象(一个 .pdf 文件)发送到 Textract 并收集响应。

用于与 Textract 交互的 AWS Go 开发工具包内容似乎相当广泛,但我找不到一个很好的例子来说明如何做到这一点。

非常感谢您提供有关如何执行此操作的示例或建议。

【问题讨论】:

  • 你有没有找到一个可行的例子?亚马逊的惊人之处在于它们生成了千兆字节的文档,但实际上没有一个是有用的。

标签: amazon-web-services go amazon-textract


【解决方案1】:

要开始一项工作,您调用StartDocumentTextDetection,使用DocumentLocation 指定文件,并指定一个SNS 主题,Textract 将在完成处理您的工作时在该主题中发布通知。

你现在有两种可能:

  • 订阅 SNS 主题,当您收到消息时检索结果
  • 创建一个由 SNS 主题触发的 lambda 函数,用于检索结果。

第二个选项是 IMO 更好,因为它使用更少的计算时间(直到作业尚未完成才运行)。

要检索作业,请使用GetDocumentTextDetection

【讨论】:

    【解决方案2】:

    如果有其他人访问此网站寻找答案:

    我理解文档,好像我可以通过 textract SDK 调用 StartDocumentAnalysis 函数,但实际上缺少的是您需要先创建一个新 Session 并根据会话进行调用:

    https://docs.aws.amazon.com/sdk-for-go/api/service/textract/#New

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-02-10
      • 2021-11-01
      • 2016-03-14
      • 2020-11-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多