【问题标题】:Robust way to parse an image of a table解析表格图像的稳健方法
【发布时间】:2018-05-18 14:52:07
【问题描述】:

解析表格图像的好方法是什么?我看到this question 正在计算表中 x 的数量,但它依赖于使用 x 的图像进行搜索。

这是我要解析的表格的示例图像:

在我的情况下,数据主要是数字。如何从表格图像中提取单元格,以便每个单元格都有单独的图像可用于 OCR 和正确的数据顺序?是否存在某种机器学习解决方案,而不是计算机视觉?

我的意思是健壮:

  • 适用于不同的单元格背景
  • 不会因轮廓较粗或较细或根本没有轮廓而失败
  • 适用于不同的列/行间距

【问题讨论】:

标签: parsing computer-vision artificial-intelligence


【解决方案1】:

OCR API 似乎提供了一些与表格相关的功能。我刚刚找到它,所以我没有进一步的见解,但你可能想检查一下。您可以进行在线测试,您可以在其中选中以下框

Do receipt scanning and/or table recognition

我的结果还可以。未找到单个字母,但可识别整体文本和数字。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-03-23
    • 2013-10-30
    • 2013-06-17
    • 2017-02-03
    • 1970-01-01
    • 2016-03-04
    • 2013-10-19
    相关资源
    最近更新 更多