opencv查找文本区域块/检测文档布局答案

【问题标题】：opencv find block of text areas / detect document layoutopencv查找文本区域块/检测文档布局
【发布时间】：2018-07-22 15:34:09
【问题描述】：

我有带有文本、图像和表格的彩色图像文档。文档可以有两列。文档由区域组成：区域标题和文本（更大的字体，可以有不同的字体颜色和类似子标题的附加数据）。

这是示例图像，但真实的图像可以是彩色的：

我需要做什么。我需要在图像文档上找到带有标题的文本区域。我需要知道什么。方法如何划分文档以在特定部分上划分文档。

我尝试在 java 中使用 opencv（如果有人有 python 和 c++ 版本，我可以自己将其转换为 java 版本）。我在堆栈溢出方面发现了一些类似的问题，但没有一个可以帮助我。要知道我的opencv知识不是很好，只是来自网上教程和堆栈溢出。

在 opencv 方式中我的问题是否有任何好的解决方案，或者我需要使用其他东西、不同的库或应用程序来实现这一点？

一个也是唯一的要求是它必须从命令行完成。

如果我有这些区域，我可以做接下来需要做的事情，但这是阻止我的步骤。

【问题讨论】：

【解决方案1】：

你的问题解决了吗？

【讨论】：

【解决方案2】：

您可以使用文本检测结合膨胀来检测粗体文本，即标题，然后将两个连续标题之间的文本框分组为第一个标题下的文本。

【讨论】：