【发布时间】:2009-10-19 09:38:05
【问题描述】:
根据Wikipedia 的说法,“拉丁文字的准确识别,打字文本现在在诸如打印文档扫描等具有清晰成像的应用中被认为已基本解决。”但是,它没有给出引用。
我的问题是:这是真的吗?当前的最先进技术是否如此出色以至于 - 对于英文文本的良好扫描 - 没有任何重大改进需要改进?
或者,这个问题的一个不太主观的形式是:现代 OCR 系统在识别英文文本以进行高质量扫描方面的准确度如何?
【问题讨论】:
-
嗯,你在维基百科上读过它,所以它一定是真的。
-
这个编程有什么关系?
-
因为是编程问题?
-
我也看不出这与编程有什么关系,但更重要的是,我在这里看不到真正的问题。老实说,“有多准确(...)”是一个非常主观的问题...
-
好问题。由于 OCR 的输出本身很少有用,但通常是某些文本和/或布局提取软件的输入,并且通常需要编程按摩,我将此视为与编程相关的问题。
标签: ocr text-extraction layout-extraction