【问题标题】:handwriting recognition with simple training简单训练的手写识别
【发布时间】:2011-09-02 06:26:39
【问题描述】:

我一直在阅读(并尝试)以前的答案中建议的 OCR 程序,但我仍然没有明确的答案。

我需要识别手写英文文本。文本将是多行,但每行只有一个或两个单词的长度。这段文字来自不同的人。我可以要求那个人提供一个培训文件(例如,带有字母和 0-9 数字),但我真的不能要求比这更复杂的培训。

我需要将识别集成为另一个 (Java) 应用程序的一部分,但解决方案不需要是 Java。我可以从 Java 中执行它并从文本文件中获取结果。

有什么建议吗?

我已经测试过 Tesseract(没有训练的糟糕结果,而且训练看起来相当复杂)。 Java OCR 看起来像是完美的解决方案(简单的培训、开源和 Java),但即使使用他们自己的示例也不能很好地工作(有人有更好的经验吗?)。 GOCR 似乎不是很活跃。

我当然更喜欢免费的解决方案,但这不是必须的(尽管我看到商业选项的问题是我必须能够将它集成到我自己的应用程序中,该应用程序将作为 SaaS 提供)

【问题讨论】:

  • 手写识别和所谓的手写识别是有区别的。区别主要在于字符是否相互连接。手工填写的非连接字符广泛用于表单识别,这种技术称为ICR(与OCR和HWR相对)。

标签: ocr handwriting


【解决方案1】:

根据我的经验,ABBYY 是最好的手写识别之一,即使没有经过培训。 (不过,它也可能是最昂贵的之一......)他们有一个用于 Java 的 SDK。

http://www.abbyy.com

免费试用,绝对值得一看!

【讨论】:

  • 其他人似乎不同意(关于 ABBYY 在手写识别方面的优势),但我当然会试一试。您还尝试过哪些其他选择?
  • ABBYY 根本不做手写识别,但它做手印识别,即所谓的 ICR。 IT广泛用于表单处理。基于问题 - 数字识别,ICR 是那里实际需要的。
  • 那么问题是关于数字和字母的识别。我想我可以要求用户确保字符是分开的,然后我就可以使用 ICR。 ¿ 对 ICR 开源或免费引擎的推荐?
  • 试过了。都不好。他们的网站界面需要工作。它只是给了我一个我已经上传的副本。
  • 答案与他们的 Abbyy FineReader 软件的功能有关,而不是他们网站的可用性。
【解决方案2】:

我正在寻找一款手写文本识别软件。到目前为止,唯一比 abby 11 提供更好结果的是 SimpleOCR,它对两者使用相同的文本,这是 ocr 的免费软件,但 HCR 的试用期为 14 天!

【讨论】:

    【解决方案3】:

    我知道我在将近 6 年后才回答。但如果有人还在寻找,请尝试使用 tensorflow。他们的网站有一个简单的手写数字识别 (MNIST) 示例。您可以使用此示例并将其用于手写字母识别(您需要为此提供训练数据,我使用 NIST 特殊数据库 19 来获取此数据)。

    【讨论】:

    • tensorflow 无法识别开箱即用的真实手写文本。它只能解析打印字母(这基本上就是 MNIST)。真正的手写要困难得多,因为您必须考虑草书、连字等。
    猜你喜欢
    • 2016-08-19
    • 2016-06-11
    • 1970-01-01
    • 2012-09-20
    • 2012-12-07
    • 2014-06-04
    • 1970-01-01
    • 2012-06-01
    • 1970-01-01
    相关资源
    最近更新 更多