【问题标题】:How to split number in image(OCR)?如何分割图像中的数字(OCR)?
【发布时间】:2018-07-10 08:10:28
【问题描述】:

我想识别图像中的数字,数字没有排成一行并且有一些“噪音”,例如下面的图像(只是我数据的一部分): 我搜索了一些项目和论文,但没有找到解决问题的好方法,谁能给我一些提示,我该如何解决问题或什么论文对我有用? 谢谢!!!

【问题讨论】:

    标签: image-processing ocr


    【解决方案1】:

    如果分割很困难,那么简单地避免它。手写识别面临同样的问题:如何将这张图片(来源:IAM 数据集)分割成字符?

    端到端可训练神经网络 (NN) 能够识别此类图像中的文本。 这些 NN 使用成对的图像和真实文本进行训练。您不必进行任何分割,也不必指定字符位置。

    这是一个用于文本识别的神经网络的示例(实现参见https://github.com/githubharald/SimpleHTR)。

    它包含 CNN 层、RNN 层和最终的 CTC 层。这个 CTC 层是能够以无分割方式进行训练的成分。

    我不想过多地重复自己,看看这篇文章来了解这样一个神经网络的样子和它是如何工作的:https://towardsdatascience.com/2326a3487cd5

    阅读本文以进行更深入的讨论和进一步的参考:https://arxiv.org/pdf/1507.05717.pdf

    【讨论】:

    • 感谢您的回答!现在我放弃了分割,我对深度学习知之甚少,但我知道这是我解决问题的最佳方法,感谢您提供的资源!
    猜你喜欢
    • 1970-01-01
    • 2018-10-23
    • 1970-01-01
    • 1970-01-01
    • 2011-08-29
    • 2020-02-10
    • 1970-01-01
    • 1970-01-01
    • 2022-10-17
    相关资源
    最近更新 更多