【问题标题】:AWS Rekognition -- How to Parse All the Text in an Image?AWS Rekognition -- 如何解析图像中的所有文本?
【发布时间】:2021-01-14 19:00:39
【问题描述】:

我正在尝试解析餐厅账单图像中的文本。我已经能够使用this example 设置具有Rekognition 客户端的ruby AWS SDK。此外,在本地,我已经能够调用 Rekognition,在本地传递图像。

当我使用#detect_text (docs) 拨打电话时,我收到了回复,回复中有TextDetections,代表图像中的线条或文字。但是,我希望该响应仅包含 LINE 类型的 TextDetections。以下是我的问题:

  1. 是否可以获得仅包含 TextDetections 类型的 LINE 的响应?
  2. 是否可以增加图像中检测到的单词的限制?显然是根据docs

DetectText 最多可以检测图像中的 50 个单词 这对我来说听起来像是一个硬性限制。

  1. 有什么方法可以绕过图像中 50 个字的限制?也许我可以对同一个图像进行多次调用,而 Rekognition 可以多次解析同一个图像,直到它包含所有单词?

【问题讨论】:

  • 据我所知:不,您不能限制响应,不,您不能增加限制,不,但是多次裁剪和解析是常用的方法。使用 OCR 库而不是 Rekognition 可能会更好,因为 Rekognition 的主要目的是检测对象而不是文本。

标签: ruby amazon-web-services amazon-rekognition


【解决方案1】:

是的。您不能在图像中检测到超过 50 个单词。一种解决方法是将图像裁剪成多个图像,并在每个裁剪的图像上运行 DetectText。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多