【发布时间】:2021-03-29 00:06:52
【问题描述】:
【问题讨论】:
标签: python image image-processing python-imaging-library
【问题讨论】:
标签: python image image-processing python-imaging-library
检测框架文本的一些想法主要归结为搜索相当大的框/矩形:
使用 OpenCV 查找轮廓,使用cv2.approxPolyDP() 多边形近似算法(也称为Ramer–Douglas–Peucker algorithm)分析形状。您还可以检查边界框的纵横比以确保形状是矩形,并检查页面宽度,因为这在您的情况下似乎是一个已知指标。 PyImageSearch 做了这篇很棒的文章:
在related question 中,还有一个建议是查看Hough Lines 以检测水平线,以同样的方式轮流检测垂直线。不能 100% 确定这种方法的可靠性。
找到框框后,下一步就是检查框框内是否有任何文字。检测文本通常是一个更广泛的问题,有很多方法可以做到这一点,这里有几个例子:
tesseract(例如通过pytesseract)但不确定这是否不会有太多误报
如果这是一个更简单的盒子是否为空的情况,您可以检查内部的平均像素值 - 例如与cv2.countNonZero()。例子:
其他参考资料:
【讨论】: