AWS Rekognition -- 如何解析图像中的所有文本？

【问题标题】：AWS Rekognition -- How to Parse All the Text in an Image?AWS Rekognition -- 如何解析图像中的所有文本？
【发布时间】：2021-01-14 19:00:39
【问题描述】：

我正在尝试解析餐厅账单图像中的文本。我已经能够使用this example 设置具有Rekognition 客户端的ruby AWS SDK。此外，在本地，我已经能够调用 Rekognition，在本地传递图像。

当我使用#detect_text (docs) 拨打电话时，我收到了回复，回复中有TextDetections，代表图像中的线条或文字。但是，我希望该响应仅包含 LINE 类型的 TextDetections。以下是我的问题：

是否可以获得仅包含 TextDetections 类型的 LINE 的响应？
是否可以增加图像中检测到的单词的限制？显然是根据docs：

DetectText 最多可以检测图像中的 50 个单词这对我来说听起来像是一个硬性限制。

有什么方法可以绕过图像中 50 个字的限制？也许我可以对同一个图像进行多次调用，而 Rekognition 可以多次解析同一个图像，直到它包含所有单词？

【问题讨论】：

据我所知：不，您不能限制响应，不，您不能增加限制，不，但是多次裁剪和解析是常用的方法。使用 OCR 库而不是 Rekognition 可能会更好，因为 Rekognition 的主要目的是检测对象而不是文本。

标签： ruby amazon-web-services amazon-rekognition

【解决方案1】：

是的。您不能在图像中检测到超过 50 个单词。一种解决方法是将图像裁剪成多个图像，并在每个裁剪的图像上运行 DetectText。

【讨论】：

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01
1970-01-01

相关资源

下载 2023-02-17
下载 2023-02-14
下载 2023-02-15

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode