【问题标题】:opencv find block of text areas / detect document layoutopencv查找文本区域块/检测文档布局
【发布时间】:2018-07-22 15:34:09
【问题描述】:

我有带有文本、图像和表格的彩色图像文档。 文档可以有两列。 文档由区域组成:区域标题和文本(更大的字体,可以有不同的字体颜色和类似子标题的附加数据)。

这是示例图像,但真实的图像可以是彩色的:

我需要做什么。 我需要在图像文档上找到带有标题的文本区域。 我需要知道什么。 方法如何划分文档以在特定部分上划分文档。

我尝试在 java 中使用 opencv(如果有人有 python 和 c++ 版本,我可以自己将其转换为 java 版本)。我在堆栈溢出方面发现了一些类似的问题,但没有一个可以帮助我。要知道我的opencv知识不是很好,只是来自网上教程和堆栈溢出。

在 opencv 方式中我的问题是否有任何好的解决方案,或者我需要使用其他东西、不同的库或应用程序来实现这一点?

一个也是唯一的要求是它必须从命令行完成。

如果我有这些区域,我可以做接下来需要做的事情,但这是阻止我的步骤。

【问题讨论】:

  • 你能再发布一些示例图片吗?这将使我们了解您试图在解决方案中适应的不同格式。

标签: java python c++ opencv computer-vision


【解决方案1】:

你的问题解决了吗?

我正在解决类似的问题。 我的解决方案是使用HoughLineshttps://docs.opencv.org/3.4.0/d9/db0/tutorial_hough_lines.html

【讨论】:

    【解决方案2】:

    您可以使用文本检测结合膨胀来检测粗体文本,即标题,然后将两个连续标题之间的文本框分组为第一个标题下的文本。

    【讨论】:

      猜你喜欢
      • 2017-02-25
      • 1970-01-01
      • 1970-01-01
      • 2016-10-10
      • 2011-08-29
      • 2014-08-14
      • 2015-01-13
      • 2011-02-18
      • 2014-06-15
      相关资源
      最近更新 更多