如何分割图像中的数字（OCR）？答案

【问题标题】：How to split number in image(OCR)?如何分割图像中的数字（OCR）？
【发布时间】：2018-07-10 08:10:28
【问题描述】：

我想识别图像中的数字，数字没有排成一行并且有一些“噪音”，例如下面的图像（只是我数据的一部分）：我搜索了一些项目和论文，但没有找到解决问题的好方法，谁能给我一些提示，我该如何解决问题或什么论文对我有用？谢谢！！！

【问题讨论】：

【解决方案1】：

如果分割很困难，那么简单地避免它。手写识别面临同样的问题：如何将这张图片（来源：IAM 数据集）分割成字符？

端到端可训练神经网络 (NN) 能够识别此类图像中的文本。这些 NN 使用成对的图像和真实文本进行训练。您不必进行任何分割，也不必指定字符位置。

这是一个用于文本识别的神经网络的示例（实现参见https://github.com/githubharald/SimpleHTR）。

它包含 CNN 层、RNN 层和最终的 CTC 层。这个 CTC 层是能够以无分割方式进行训练的成分。

我不想过多地重复自己，看看这篇文章来了解这样一个神经网络的样子和它是如何工作的：https://towardsdatascience.com/2326a3487cd5

阅读本文以进行更深入的讨论和进一步的参考：https://arxiv.org/pdf/1507.05717.pdf

【讨论】：