【发布时间】:2021-01-14 19:00:39
【问题描述】:
我正在尝试解析餐厅账单图像中的文本。我已经能够使用this example 设置具有Rekognition 客户端的ruby AWS SDK。此外,在本地,我已经能够调用 Rekognition,在本地传递图像。
当我使用#detect_text (docs) 拨打电话时,我收到了回复,回复中有TextDetections,代表图像中的线条或文字。但是,我希望该响应仅包含 LINE 类型的 TextDetections。以下是我的问题:
- 是否可以获得仅包含
TextDetections类型的LINE的响应? - 是否可以增加图像中检测到的单词的限制?显然是根据docs:
DetectText 最多可以检测图像中的 50 个单词 这对我来说听起来像是一个硬性限制。
- 有什么方法可以绕过图像中 50 个字的限制?也许我可以对同一个图像进行多次调用,而 Rekognition 可以多次解析同一个图像,直到它包含所有单词?
【问题讨论】:
-
据我所知:不,您不能限制响应,不,您不能增加限制,不,但是多次裁剪和解析是常用的方法。使用 OCR 库而不是 Rekognition 可能会更好,因为 Rekognition 的主要目的是检测对象而不是文本。
标签: ruby amazon-web-services amazon-rekognition