【发布时间】:2018-05-18 14:52:07
【问题描述】:
解析表格图像的好方法是什么?我看到this question 正在计算表中 x 的数量,但它依赖于使用 x 的图像进行搜索。
这是我要解析的表格的示例图像:
在我的情况下,数据主要是数字。如何从表格图像中提取单元格,以便每个单元格都有单独的图像可用于 OCR 和正确的数据顺序?是否存在某种机器学习解决方案,而不是计算机视觉?
我的意思是健壮:
- 适用于不同的单元格背景
- 不会因轮廓较粗或较细或根本没有轮廓而失败
- 适用于不同的列/行间距
【问题讨论】:
-
如果您愿意,我认为最简单的方法是尝试一些自定义对象检测 API,例如 app.nanonets.com/ObjectCategorySelection
-
然后匹配文本?我想我会尝试
-
stackoverflow.com/questions/33452222/detect-table-with-opencv/… 的解决方案可能会对一些小调整有所帮助。
标签: parsing computer-vision artificial-intelligence