【问题标题】:Clarification about card.io models for character recognition关于用于字符识别的 card.io 模型的说明
【发布时间】:2015-04-27 08:40:45
【问题描述】:

我开始将 card.io 视为 Android 应用程序的一部分,它应该能够扫描卡并识别卡号、到期日期、持卡人。

在挖掘了一段时间后,我进入了 card.io-dmz/models/generated 文件夹,在那里我看到了一些文件,根据开头的评论,这些文件是“从模型/conv/...自动生成的”。

但是,我无法找到有关用于生成这些“模型”的文件的详细信息。检查代码后,我假设这些生成的文件直接负责卡片中数字的 OCR。

举个例子,下面的卡片被扫描并识别得很好(仅限数字)

但是下面的卡失败了

我尝试在垂直分割完成之前调整 ROI,但我认为两张卡上使用的字体之间的差异导致无法扫描第二张卡。

我的问题确实是,鉴于 git hub 的当前开源项目,是否有人可以添加类似于上面黑色的扫描卡的功能,或者这需要访问其他资源执行实际的 OCR?

【问题讨论】:

    标签: card.io


    【解决方案1】:

    来自 card.io 的 Dave。

    @Adrian 你的结论都是正确的。

    虽然我们很乐意扩展我们的 deep-learning 字符识别模型以涵盖较新样式的卡片,例如上面的第二张卡片,但这是一项艰巨的任务。

    首先需要更新定位卡号的代码,然后训练新的字符识别模型,需要相当多的新型卡片(约 100 张)。

    目前,这不适合开源。出于某种原因,人们往往不想分享他们的信用卡图片。

    我们已经考虑过创建一个开源应用程序,该应用程序可用于收集卡片图像的某些部分(例如,所有数字位置,以及仅少数数字的实际图像,加上到期日期的图像)。然后也许我们可以众包一个有用的大量信息集合。在构建该集合的同时,我们可以开源我们为使用计算机视觉和深度学习而创建的许多内部工具。

    你会参与这样的项目吗?

    【讨论】:

    • 为什么不将 tesseract 与 card.io 集成
    猜你喜欢
    • 1970-01-01
    • 2015-06-26
    • 1970-01-01
    • 1970-01-01
    • 2020-07-05
    • 1970-01-01
    • 1970-01-01
    • 2014-01-11
    • 2012-04-01
    相关资源
    最近更新 更多