【发布时间】:2018-05-30 16:27:59
【问题描述】:
我正在尝试使用 Microsoft 的计算机视觉 OCR API 从图像上的表格中获取信息。我遇到的问题是返回的数据通常有各种各样的 qwerky 区域,我试图将所有区域拼凑在一起以获得完整的可读和可解析文本行。
我认为有意义的唯一方法是使用方向旋转边界框坐标并检查哪些“线”在另一个给定边界框高度的给定百分比范围内 - 可能是 20% 或所以。
这实际上是我迄今为止想到的唯一方法,我开始认为我已经过度复杂化了;人们倾向于建立 OCR 区域以获得可读文本的标准方法吗?
【问题讨论】:
标签: computer-vision ocr text-extraction