【发布时间】:2017-04-15 20:59:15
【问题描述】:
我正在使用 opencv2 和 pytesseract 从来自我的相机的视频流中提取一些文本。我裁剪图像以获得另一个小图像。我进行了不同的图像处理以使其正常工作。我反转了图像值,模糊了它,二值化了它,但是这些都没有与 tesseract 一起使用。我要提取的数据有这些形式'float/float'这里是小图像的例子:
似乎字符没有分开,这是我可以从我的相机获得的最大分辨率。然后我尝试按颜色过滤,但没有结果,因为它是视频并且背景总是在移动。 我将使用任何建议的 Python 模块。
【问题讨论】:
-
你尝试过每个字符的模板匹配吗?
-
感谢 Miki 的回复,我的速度是 25 帧/秒,是否可以为每个字符一个一个地进行模板匹配?我必须将这个小图像分成比比较小的图像吗?
-
我不能保证帧率,但应该比任何其他 OCR 方法都快。您有 10 个用于 10 位数字的模板,可能有 1 个用于斜线(而 1 个用于点?)。然后在整个图像上应用模板匹配 11 (12) 次(每个模板)。查看匹配结果中的最大值,您应该能够找到正确的数字...
-
嗨 mikki,这种情况下的模板匹配不起作用。
标签: python opencv tesseract orc