识别图像上字符的开始和结束 XY 向量答案

【问题标题】：Identifying start and end XY vector of characters on image识别图像上字符的开始和结束 XY 向量
【发布时间】：2011-09-26 06:55:55
【问题描述】：

我正在尝试回忆一些关于字母的信息，以使用神经网络开始某种 OCR。我还没有真正将所有的东西结合在一起，但是，我现在遇到的问题是如何区分字符并将它们分开。类似http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ （没什么花哨的，只是常见的字体）

考虑到每个字符和数字都有相互连接的黑色像素（尽管 i 是一个例外），我认为更好的方法是制作大量的 for 循环来获得顶部、最低 x 和 y。

是否有任何类型的库或算法可以帮助我解决这个问题？我正在使用 Cimg 进行图像处理。

这真的很难吗？

【问题讨论】：

标签： c++ cimg

【解决方案1】：

听起来您正在寻找一个连接组件标签器。这个想法是扫描图像中相互连接的像素组，并返回一组对象（通常称为“blob”），其中每个对象都包含该 blob 中的像素列表。

我不建议尝试自己编写。 OpenCV 内置了一个运行良好且基于

F.Chang、C.-J.Chen 和 C.-J.Lu，“使用轮廓跟踪技术的线性时间组件标记算法，”计算机视觉和图像理解，卷。 93，没有。 2，第 206-220 页，2004 年。

很可能有更好的解决方案专门用于查找字母。

【讨论】：

感谢您的回答。我会研究 OpenCV，我同意如果已经有一些算法可以使用，我应该尽量避免自己做。 opencv.willowgarage.com/wiki/cvBlobsLib#Features 你说的是不是？

【解决方案2】：

您检查过OpenCV 项目吗？ Here 是一个用它做数字 OCR 的教程。

【讨论】：