【问题标题】:How to improve read tesseract accuracy in c#如何在 C# 中提高读取 tesseract 的准确性
【发布时间】:2020-01-16 05:20:22
【问题描述】:

我尝试了很多方法来改善我的图像,以便 tesseract 如此清晰地读取。但我仍然得到错误的结果,我需要知道我需要采取什么方法来解决这个问题。谢谢

【问题讨论】:

  • 尝试黑白转换+【颜色反转】+【阈值调整】。请参阅注释here。您也可以尝试调整 Gamma。请参阅有关 ImageAttributes 类的文档。
  • 感谢您的评论,我已经解决了我的问题,但我遇到了“NIK”行的问题,因为数字的字体不同,并且 OCR @Jimi 总是无法读取

标签: c# image-processing tesseract emgucv


【解决方案1】:

要提高准确性,您需要一些解决方法 .将图像转换为黑白 .增加对比度,使黑色在白色上更具可读性。 当您获得 tesseract 结果时,您必须对其进行处理 .例如,在您的结果中,您可以在第一行看到 (:) 列之后有数字。当您查看结果时,所有 4 都转换为 u,因此您可以编写一个函数并基于某些条件,例如 -什么时候是同一种文件 - 当它必须是一个数字时 u 是 4 (u->4) 等等。 Tesseract 是通用 ocr 引擎,因此您必须对结果稍加调整,以使其更具体地适用于您阅读的文档类型。

【讨论】:

    猜你喜欢
    • 2020-12-08
    • 1970-01-01
    • 2021-06-30
    • 1970-01-01
    • 2017-04-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-29
    相关资源
    最近更新 更多