【发布时间】:2015-03-08 22:46:30
【问题描述】:
我有一个项目,其中有一张图片(.bmp、.jpeg 等),其中包含明确定义的表格结构(比如 4x6 或 1x10,简单结构)。我需要从该图片中的单元格中提取数据,我所需要的只是检测单元格的开始和结束位置(像素坐标,或者如果有其他方法的话),这样我就可以处理该单元格内的图像部分。我在一些人工智能项目(TD-learning、Q-learning、神经网络)方面获得了一些经验,但从未参与过需要计算机视觉的项目,因此我在该领域的知识非常有限。想到图片上的表结构检测的任何指示或算法?
【问题讨论】:
-
表格可以有多种不同的样式(有或没有外边框、单元格边框)。还有对齐问题:您的表格可能与您的图像边框不完全对齐。我宁愿尝试检测单元格中的数字,以及它们在两个轴上的对齐方式,我想这就是我们检测这些模式的方式。
-
但是,我的建议是基于对图像进行的某种预先存在的 OCR 工作,在此基础上进行检测。也许您正在考虑一种不同的方法。
-
@didierc 非常感谢您的建议。那么您的解决方案是获取所有字符,将其转换为简单的文本列表数据并应用基于块分割算法的结构识别?我承认,这是一个非常好的主意,如果我找不到首先获得结构的方法,我可能会考虑它。我已经拥有并充分研究了一种 OCR 算法(我计划在获得细胞图像后应用该算法)。
标签: algorithm computer-vision artificial-intelligence image-recognition pattern-recognition