【发布时间】:2011-09-26 06:55:55
【问题描述】:
我正在尝试回忆一些关于字母的信息,以使用神经网络开始某种 OCR。我还没有真正将所有的东西结合在一起,但是,我现在遇到的问题是如何区分字符并将它们分开。类似http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ (没什么花哨的,只是常见的字体)
考虑到每个字符和数字都有相互连接的黑色像素(尽管 i 是一个例外),我认为更好的方法是制作大量的 for 循环来获得顶部、最低 x 和 y。
是否有任何类型的库或算法可以帮助我解决这个问题?我正在使用 Cimg 进行图像处理。
这真的很难吗?
【问题讨论】: