从网格图像中提取文本答案

【问题标题】：Extracting text from a grid image从网格图像中提取文本
【发布时间】：2018-08-29 23:34:20
【问题描述】：

我需要从网格图像中提取文本段以进行 OCR。我尝试了多种方法，例如 HoughLines、连接组件、形态学操作等，但我没有得到令人满意的结果。有人可以提出更好的方法吗？我附上了一些示例图片

【问题讨论】：

我可以用数学形态学完全解决这个问题，但你想要更好的东西......叹息。说你已经尝试过是没有帮助的。如果您需要帮助，请说明您的尝试以及不满意的原因。我们也许可以帮助改进您的方法。我们不会为您编写所有代码。
我在这里stackoverflow.com/a/46806306/5545458 给出了基于连接组件的网格/线检测和删除，这可能会有所帮助。
在这种情况下我最喜欢修补的方法之一，还有一些需要注意的地方：microsoft.com/en-us/research/publication/stroke-width-transform

【解决方案1】：

除非您尝试从头开始进行 OCR，否则我建议您使用 Tesseract。您列出的方法只是 OCR 过程中的特征提取步骤。 This python implementation 非常简单，可以为您完成繁重的工作。祝你好运！

【讨论】：