【发布时间】:2018-07-10 08:10:28
【问题描述】:
我想识别图像中的数字,数字没有排成一行并且有一些“噪音”,例如下面的图像(只是我数据的一部分): 我搜索了一些项目和论文,但没有找到解决问题的好方法,谁能给我一些提示,我该如何解决问题或什么论文对我有用? 谢谢!!!
【问题讨论】:
标签: image-processing ocr
我想识别图像中的数字,数字没有排成一行并且有一些“噪音”,例如下面的图像(只是我数据的一部分): 我搜索了一些项目和论文,但没有找到解决问题的好方法,谁能给我一些提示,我该如何解决问题或什么论文对我有用? 谢谢!!!
【问题讨论】:
标签: image-processing ocr
如果分割很困难,那么简单地避免它。手写识别面临同样的问题:如何将这张图片(来源:IAM 数据集)分割成字符?
端到端可训练神经网络 (NN) 能够识别此类图像中的文本。 这些 NN 使用成对的图像和真实文本进行训练。您不必进行任何分割,也不必指定字符位置。
这是一个用于文本识别的神经网络的示例(实现参见https://github.com/githubharald/SimpleHTR)。
它包含 CNN 层、RNN 层和最终的 CTC 层。这个 CTC 层是能够以无分割方式进行训练的成分。
我不想过多地重复自己,看看这篇文章来了解这样一个神经网络的样子和它是如何工作的:https://towardsdatascience.com/2326a3487cd5
阅读本文以进行更深入的讨论和进一步的参考:https://arxiv.org/pdf/1507.05717.pdf
【讨论】: