图像上框架文本的坐标

【问题标题】：Coordinates of framed text on an image图像上框架文本的坐标
【发布时间】：2021-03-29 00:06:52
【问题描述】：

我想获取图像上框架文本的坐标。段落有细的黑色边框。图片的其余部分包含常用的段落和草图。

这里是一个例子：

你知道我应该在 Python 中使用什么样的算法和图像库来实现这一点吗？谢谢。

【问题讨论】：

标签： python image image-processing python-imaging-library

【解决方案1】：

检测框架文本的一些想法主要归结为搜索相当大的框/矩形：

使用 OpenCV 查找轮廓，使用cv2.approxPolyDP() 多边形近似算法（也称为Ramer–Douglas–Peucker algorithm）分析形状。您还可以检查边界框的纵横比以确保形状是矩形，并检查页面宽度，因为这在您的情况下似乎是一个已知指标。 PyImageSearch 做了这篇很棒的文章：
- OpenCV shape detection
在related question 中，还有一个建议是查看Hough Lines 以检测水平线，以同样的方式轮流检测垂直线。不能 100% 确定这种方法的可靠性。

找到框框后，下一步就是检查框框内是否有任何文字。检测文本通常是一个更广泛的问题，有很多方法可以做到这一点，这里有几个例子：

申请EAST text detector
PixelLink
tesseract（例如通过pytesseract）但不确定这是否不会有太多误报
如果这是一个更简单的盒子是否为空的情况，您可以检查内部的平均像素值 - 例如与cv2.countNonZero()。例子：
- How to identify empty rectangle using OpenCV
- Count the black pixels using OpenCV

其他参考资料：

ideas on quadrangle/rectangle detection using convolutional neural networks

【讨论】：

但是即使在检测到矩形之后，您也需要验证其中是否有文本，对吗？如果有带有空白区域的矩形怎么办？我认为您之后需要在矩形块内进行某种 OCR 检测。
@Ananda 好点。我最初考虑将 tesseract 用于过滤掉的矩形轮廓，但这可能会导致误报。我认为 EAST 会起作用 - 在答案中添加了一些信息。谢谢。

猜你喜欢

1970-01-01
1970-01-01
2011-08-17
2021-05-31
2021-08-29
1970-01-01
2014-04-16
1970-01-01
1970-01-01

相关资源

下载 2023-01-08
下载 2021-06-27
下载 2023-01-12
下载 2023-01-14
下载 2022-12-25

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode