【问题标题】:Extracting text from a grid image从网格图像中提取文本
【发布时间】:2018-08-29 23:34:20
【问题描述】:

我需要从网格图像中提取文本段以进行 OCR。我尝试了多种方法,例如 HoughLines、连接组件、形态学操作等,但我没有得到令人满意的结果。有人可以提出更好的方法吗?我附上了一些示例图片

【问题讨论】:

  • 我可以用数学形态学完全解决这个问题,但你想要更好的东西......叹息。说你已经尝试过是没有帮助的。如果您需要帮助,请说明您的尝试以及不满意的原因。我们也许可以帮助改进您的方法。我们不会为您编写所有代码。
  • 我在这里stackoverflow.com/a/46806306/5545458 给出了基于连接组件的网格/线检测和删除,这可能会有所帮助。
  • 在这种情况下我最喜欢修补的方法之一,还有一些需要注意的地方:microsoft.com/en-us/research/publication/stroke-width-transform

标签: opencv image-processing computer-vision


【解决方案1】:

除非您尝试从头开始进行 OCR,否则我建议您使用 Tesseract。您列出的方法只是 OCR 过程中的特征提取步骤。 This python implementation 非常简单,可以为您完成繁重的工作。祝你好运!

【讨论】:

  • 感谢您的回复。
猜你喜欢
  • 2014-07-31
  • 2020-04-09
  • 2011-11-29
  • 1970-01-01
相关资源
最近更新 更多