【问题标题】:Coordinates of framed text on an image图像上框架文本的坐标
【发布时间】:2021-03-29 00:06:52
【问题描述】:

我想获取图像上框架文本的坐标。段落有细的黑色边框。图片的其余部分包含常用的段落和草图。

这里是一个例子:

你知道我应该在 Python 中使用什么样的算法和图像库来实现这一点吗?谢谢。

【问题讨论】:

    标签: python image image-processing python-imaging-library


    【解决方案1】:

    检测框架文本的一些想法主要归结为搜索相当大的框/矩形:

    • 使用 OpenCV 查找轮廓,使用cv2.approxPolyDP() 多边形近似算法(也称为Ramer–Douglas–Peucker algorithm)分析形状。您还可以检查边界框的纵横比以确保形状是矩形,并检查页面宽度,因为这在您的情况下似乎是一个已知指标。 PyImageSearch 做了这篇很棒的文章:

    • related question 中,还有一个建议是查看Hough Lines 以检测水平线,以同样的方式轮流检测垂直线。不能 100% 确定这种方法的可靠性。


    找到框框后,下一步就是检查框框内是否有任何文字。检测文本通常是一个更广泛的问题,有很多方法可以做到这一点,这里有几个例子:


    其他参考资料:

    【讨论】:

    • 但是即使在检测到矩形之后,您也需要验证其中是否有文本,对吗?如果有带有空白区域的矩形怎么办?我认为您之后需要在矩形块内进行某种 OCR 检测。
    • @Ananda 好点。我最初考虑将 tesseract 用于过滤掉的矩形轮廓,但这可能会导致误报。我认为 EAST 会起作用 - 在答案中添加了一些信息。谢谢。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2011-08-17
    • 2021-05-31
    • 2021-08-29
    • 1970-01-01
    • 2014-04-16
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多