【发布时间】:2011-12-25 14:22:18
【问题描述】:
我正在尝试从您可以在高中体育馆找到的典型记分牌中提取数字。我将每个数字都放在数字“闹钟”字体中,并设法从视频源中正确透视、阈值并提取给定数字
这是我的模板输入示例
我的问题是没有一种分类方法可以准确地确定所有数字 0-9。我尝试了几种方法
1) Tesseract OCR - 这个总是搞砸 4 并且经常返回奇怪的结果。只需使用命令行版本。如果我真的尝试用“闹钟”字体训练它,我每次都会得到未知字符。
2) 使用 OpenCV 的 kNearest - 我搜索包含我的模板图像 (0-9) 的数据库,并查看哪个是最近的。我经常混淆 3/1 和 7/1
3) cvMatchShapes - 这个相当糟糕,它通常无法区分每个输入数字的两个数字之间的差异
4) 切线距离 - 这是最近的,但输入和我的模板之间的最小切线距离最终每次都将“7”映射到“1”
对于这样一个简单的问题,我真的很茫然。我觉得我已经很好地清理了输入,这是一个相当简单的分类案例,但我无法获得足够可靠的东西来实际使用。任何关于在哪里寻找分类算法或如何正确使用它们的想法都将不胜感激。我没有清理输入吗?那么更好的输入数据库呢?我不知道我还能用什么来输入,此时每个数字和模板看起来都很准确。
【问题讨论】:
标签: image-processing opencv computer-vision ocr